摘要:近期,人脸识别技术在社会上广受关注,其非接触式的识别特性相较于指纹等传统接触式识别方法展现出明显优势。在深度学习领域,由于传统卷积神经网络在人脸识别任务上的准确性和速度尚有提升空间,因此提出采用改进的AlexNet卷积神经网络进行人脸识别。通过实验验证,与传统卷积网络相比,改进后的AlexNet在人脸识别上不仅准确度更高,而且识别过程更为稳定。
摘要:目前,可再生能源大量接入配电网,但是太阳能、风能、光伏及风电等可再生能源的间歇性和随机性不可避免地会造成配电网的波动。考虑电网内可再生能源发电功率与用电负荷随时间变化的特点,提出一种基于小波变换和神经网络的可再生能源接入配电网的负荷预测和优化方法。首先采集配电网的发电与负荷数据,利用小波变换处理收集到的数据,得到局部尺度和频率分解的特征参数,建立神经网络预测模型;然后,对经过小波变换后得到的特征参数进行训练,根据预测负荷对可再生能源的发电量进行调节,保持配电网供需侧的动态平衡。结果表明,所提方法能够对负荷进行有效预测,通过提前预测负荷量,保证配电网用电稳定性的同时,最大化利用可再生能源。
摘要:目前的人工视觉系统仍然无法处理一些涉及高速运动场景和高动态范围的真实世界场景。事件相机因其低延迟和高动态范围捕捉高速运动的优势具有消除上述问题的能力。然而,由于事件数据的高度稀疏和变化性质,在保证其快速性的同时将事件重建为视频仍然具有挑战性。因此提出了一种基于Transformer残差网络和光流估计的事件流重建算法,通过光流估计和事件重建的联合训练,实现自监督的重建过程,并引入去模糊预处理和亚像素上采样模块来提高重建质量。实验结果表明,在公开数据集上,提出的方法可以有效提高事件流的重建效果。
摘要:miRNA的突变和异常表达可能导致各种疾病,因此预测miRNA与疾病的潜在相关性对于临床医学和药物研究的发展具有重要意义。拓扑结构是miRNA-疾病预测算法的重要组成部分,然而当前算法并未有效利用拓扑结构导致预测结果并不理想。与此同时,如何有效地融合多源数据也是当前的研究趋势。针对上述问题,提出一种自适应融合异质节点结构信息算法(MMTP),通过利用节点的一阶邻居和元路径诱导网络学习结构特征,并利用度量学习和拓扑传播自适应地融合异质节点结构信息,以提升miRNA-疾病预测精度。5折交叉验证实验结果表明,MMTP在HMDD v3.2数据集上的受试者操作曲线下面积(AUC)为94.81,高于其他模型。并且在基于肾癌的案例研究中,该模型所预测的前30个miRNAs全部得到证实。上述研究证明,所提的MMTP模型可有效预测miRNA-疾病相关性。
摘要:全球老龄化时代的到来引发的老年人健康监护问题不可忽视,而室内跌倒对独居的老年人有非常大的安全隐患。因此,为准确检测到跌倒动作,使用毫米波雷达三维点云信息进行室内跌倒检测,并提出一种基于外部注意力机制的PointLSTM网络实现三维点云在时序的分类。通过MIMO体制的毫米波雷达芯片采集人体动作的回波信号,利用集成雷达基带处理器的微控制器实现信号处理的部分,可将原始数据实时转换成三维点云,并提高点云处理中的计算速度及雷达硬件的整体性能。基于外部注意力机制的PointLSTM网络可实现点云在时空中的提取特征和分类识别,网络改进了PointLSTM帧间点信息的流失问题,并在信息提取中对所有数据实现特征联系,外部注意力机制通过独立的可学习参数优化了网络复杂度和识别精确率。实验结果表明,所提出的方法在室内环境下检测准确率可以达到98.3%,可以有效区分动作的类别,并验证了使用毫米波雷达三维点云检测人体跌倒的可行性。
摘要:构建基于云计算的蛋白质折叠空间结构预测框架,通过数据云存储设备获取蛋白质序列原始数据,采用HDFS(Hadoop Distributed File System)分布式存储方式保存于云端。资源和队列管理器RQM(Resource Queue Management)开启云端虚拟机后,以之作为扫描节点(Sensor Node, SN),SN基于二维AB非格点模型建立最小蛋白质分子能量优化函数,采用局部搜索机制改进的量子遗传算法对其作优化求解。利用云端GPU设备处理模型训练数据,即可实现蛋白质折叠空间结构的自动化预测。实验结果表明:蛋白质序列能量势函数计算结果更小、执行效率更高、GDT-TS(Geothermal Development and Testing Tool Suite)评价指标值更大。
摘要:乔木在维持生态平衡、保护生物多样性以及调节气候和改善空气质量等方面发挥着至关重要的作用。针对复杂背景下乔木识别准确率较低的问题,提出了一种基于树木多特征融合和知识蒸馏的亚热带常见乔木识别模型MFFMN-KD-TA。该模型采用3个并行的MobileNetV3_Small主干网络分别提取树叶、树干和树木整体特征;并通过知识蒸馏和嵌入Triplet Attention模块的方法优化训练。试验结果表明,MFFMN-KD-TA模型在自建树木测试集上的准确率、精确率和F1分数分别为0.960 9、0.962 1和0.960 8,较MFFMN模型分别提升了3.05%、2.83%和3.07%。与三分支融合模型3-ShuffleNetV2和3-MobileNetV2相比,提出的多特征融合模型MFFMN-KD-TA参数量较小且能够较准确地识别乔木种类,为亚热带和其他地区的树种识别提供了新思路和新方法。
摘要:通过主动学习模型来选取最有价值的数据点进行标注是深度学习减少标注数据量的一种方式。预测损失模型是一类与任务无关的主动学习模型,该类模型在多个任务中都有不错的表现。但是这类模型均不是端到端的模型,不断变化的输入特征会导致损失预测网络在训练时出现输入偏差。提出了时序特征融合预测损失模型用于解决该模型的输入偏差问题。实验证明,提出的算法在各个任务中的性能与以往最先进的算法相比,平均提升约1.5%,与原预测损失模型相比,平均提升5%。
摘要:针对当前心音信号识别算法检测精度不佳问题,提出了一种混合卷积神经网络-支持向量机模型 (CNN-SVM) 的心音信号分类方法。通过PASCAL挑战实验数据,整理出正常与不正常两类心音信号数据库,通过预处理滤波及MFCC、一二阶差分特征提取、PCA降维,输入CNN-SVM模型进行训练。并从准确率、召回率、特异性、精确率和F分数5个方面进行性能评估。为了验证此算法的有效性,将混合CNN-SVM模型与单一SVM、CNN模型分别进行了对比。实验结果表明,该方法能够以较高识别率将两种心音信号区分开,其平均识别准确率接近于99%,相较于单一CNN方法提高了2.48%,同样高于单一SVM算法。
摘要:预测植物中的蛋白质-蛋白质相互作用(PPI)具有重要的生物学意义。同时采用了4种编码方法及深度神经网络构建了蛋白质相互作用预测模型。结果表明,提出的融合蛋白质语言模型Ankh与深度神经网络的方法构建的PPI预测模型性能在3种植物数据集上均获得了最优的AUPR和AUC值,Sen及MCC值也均优于其他4种蛋白质相互作用预测模型。当模型在水稻、大豆的植物PPI数据集上进行测试时,所提出的模型AUPR值分别为0.802 5、0.730 1,AUC值分别为0.956 2、0.950 7。这些优异的结果表明,融合蛋白质语言模型Ankh的PPI模型可以作为植物蛋白质相互作用预测的一个有前途的工具。
摘要:针对主动毫米波图像中目标与背景纹理区分度较低导致隐匿目标漏检问题,并根据安检实时性要求,提出一种基于全局通道注意力增强的主动毫米波图像目标检测方法。该方法以YOLOv5s为载体,在坐标注意力位置方向上引入全局通道注意模块,增强对隐匿目标全局通道信息的关注,从而提升在隐匿目标与背景纹理区分度较低时的检测能力;再利用K-means++聚类算法重新生成适合毫米波图像目标检测的锚框。实验结果表明,无论是阵列图像数据集还是线扫图像数据集,该方法增强了对隐匿目标的特征注意,提高了召回率,在满足安检实时性的前提下,提升了检测性能。通过增加少量参数,在阵列图像数据集上,精度、召回率和mAP@.5达到了92.0%、90.93%和95.32%;在线扫图像数据集上,精度、召回率和mAP@.5达到了94.65%、92.67%和97.73%。平均单张图像推理时间在两个数据集上均达到1 ms,满足实时性要求。
摘要:开展了一种基于贝塞尔曲线的智能汽车避障局部轨迹规划,即路径规划和速度规划方法研究。路径规划时,为了适应各种形状道路,将道路笛卡尔坐标转换为Frénet坐标,以路径的长度、曲率和连续性,以及车辆碰撞风险为代价函数,其中引入危险势场理论,描述车辆碰撞风险,并采用序列二次规划方法来求解路径规划这一非线性优化问题;速度规划时,以行车效率和舒适性为目标,实现速度规划,该方法可以通过调整各子目标函数的权重来满足不同驾驶需求。为了验证基于贝塞尔曲线轨迹规划算法的有效性,设计了直道和弯道上静态和动态避障场景的仿真实验,结果表明,提出的轨迹规划方法能够在各种形状道路上完成避障任务,且避障过程中车辆状态变化平稳,能够保证乘坐舒适性。
摘要:中文命名实体识别主要包括中文平面命名实体识别和中文嵌套命名实体识别两个任务,其中中文嵌套命名实体识别任务难度更大。提出了一个基于词汇增强和表格填充的统一模型TLEXNER,该模型能够同时处理上述任务。该模型首先针对中文语料分词困难的问题,使用词典适配器将词汇信息融合到BERT预训练模型,并且将字符与词汇组的相对位置信息集成到BERT的嵌入层中;然后通过条件层归一化和双仿射模型构造并预测字符对表格,使用表格建模字符与字符之间的关系,得到平面实体与嵌套实体的统一表示;最后根据字符对表格上三角区域的数值判断实体类别。提出的模型在平面实体的公开数据集Resume和自行标注的军事领域嵌套实体数据集上F1分别是97.35%和91.96%,证明了TLEXNER模型的有效性。
摘要:任务型问答系统一旦构建好,通常是固定不变的,能回答的问题非常有限,难以满足用户的需求。对此,提出一种自动实时更新知识库的方法,当用户提了一个问答系统回答不了的问题,系统会把该问题自动发送给人工客服,人工客服利用专业知识回复后,系统能够自动实时获取用户提的问题和人工客服回复的答案,并把这个问答对自动实时更新到知识库,之后如果其他用户提了类似的问题,问答系统就能够快速给出对应的答案。以政务领域的问答系统为例,应用文本向量化方法ERNIE构建知识库自动实时更新的问答系统。经过计算机实验证明,提出的方法能够实现知识库自动实时更新,构建的问答系统具有自主学习与记忆功能,提高了任务型问答系统的智能化水平。
摘要:垃圾分类是建设生态文明的重要一环,为解决重量级模型难以部署移动端设备的问题,提出基于YOLOv5网络改进的垃圾图像分类方法。采用融合GhostNet的主干网络,用线性运算代替传统卷积运算,降低了模型的参数量,提高了模型推理速度;通过在网络中加入改进版通道注意力模块,强化重要的通道特征,获取更多深层次的特征信息;采用加权边界融合方法,提升检测框的定位精度。经实验证明,该方法在自制数据集中较原模型的精度提高了8.5%,参数量减少了46.7%,平均推理速度提高了1.22 ms,实现了精度和推理速度的综合提升。
摘要:针对中文事件抽取中语义表征不充分、特征提取不全面等问题,提出一种基于RoBERTa和多层次特征的中文事件抽取方法。通过RoBERTa预训练模型构建字向量,并基于词性标注和触发词语义信息融入进行字向量扩展;其次使用双向长短时记忆网络和卷积神经网络抽取全局特征和局部特征,并通过自注意力机制捕捉不同特征之间的关联,加强对重要特征的利用;最后通过条件随机场实现BIO序列标注,完成事件抽取。在DuEE1.0数据集上,触发词抽取和事件论元抽取的F1值达到86.9%和68.0%,优于现有常用事件抽取模型,验证了该方法的有效性。
摘要:针对简单文本分类模型精度不高,预训练模型结构复杂,在实际环境中难以直接使用的问题,提出多教师知识蒸馏的文本分类方法。该模型使用“教师-学生网络”的训练方法,教师模型为BERT-wwm-ext和XLNet预训练模型,将两个模型输出的概率矩阵通过权重系数融合为软标签。学生模型为BiGRU-CNN网络,使用均方差函数计算软标签误差,使用交叉熵损失函数计算硬标签误差,通过硬标签和软标签训练学生模型使损失函数值达到最小。实验结果表明,提出的方法精度较学生模型有较大的改进,接近预训练模型,在保证分类精度的前提下减少了运行时间,提高了效率。
摘要:输电巡检图像的背景复杂,目标检测易受干扰,基于YOLOX神经网络模型,提出一种输电线路山火检测方法。首先采用YOLOX的主干特征提取网络框架,并将其中多尺度特征提取模块的常规卷积替换为可变形卷积;其次在加强特征提取阶段增加了通道注意力和空间注意力模块的融合,能够自适应火焰的外形多变特点,更加有效地提取到山火特征,从而提高目标检测的准确率。经实验验证,所提方法能够较为准确地检测到山火,满足日常巡检的需求。
摘要:人体关键点检测在智能视频监控、人机交互等领域有重要应用。针对基于热图的人体关键点检测算法依赖高分辨率热图、计算资源消耗大的问题,提出一种结合不确定性估计的轻量级算法。使用低分辨率热图,结合不确定性估计预测误差分布的尺度参数,提高了预测结果的可信度;利用尺度参数监督和约束热图,缓解梯度消失,增强了网络的鲁棒性。COCO数据集上实验结果表明,与积分姿态回归算法相比,改进后算法的平均精度提高了3.3%,降低了资源占用。
摘要:近年来,随着深度学习技术的发展,基于编解码的图像分割方法在病理图像自动化分析上的研究与应用也逐渐广泛,但由于胃癌病灶复杂多变、尺度变化大,加上数字化染色图像时易导致的边界模糊,目前仅从单一尺度设计的分割算法往往无法获得更精准的病灶边界。为优化胃癌病灶图像分割准确度,基于编解码网络结构,提出一种基于多尺度注意力融合网络的胃癌病灶图像分割算法。编码结构以EfficientNet作为特征提取器,在解码器中通过对多路径不同层级的特征进行提取和融合,实现了网络的深监督,在输出时采用空间和通道注意力对多尺度的特征图进行注意力筛选,同时在训练过程中应用综合损失函数来优化模型。实验结果表明,该方法在SEED数据集上Dice系数得分达到0.806 9,相比FCN和UNet系列网络一定程度上实现了更精细化的胃癌病灶分割。
摘要:面向法律领域的神经机器翻译对于合同文本翻译等应用场景具有重要价值。由于法律领域双语对齐语料稀缺,翻译效果还不理想。针对该问题,目前有效的方法是融入翻译记忆或翻译模版等外部信息,但法律领域的文本多具有固定的表达结构且用词准确规范,在翻译记忆库中同时利用翻译结构信息和语义信息能够进一步提升法律领域翻译性能。基于此,提出一种融入翻译记忆库的法律领域机器翻译方法。提出了一种新的法律领域翻译记忆库,首先基于语义和结构信息的相似性训练跨语言检索模型以充分利用单语数据,然后从翻译记忆库中检索与输入源句相关的一组翻译记忆和翻译模版,进而引导翻译模型生成目标句子。实验表明,在MHLAW数据集上,提出的方法可以使译文较基线模型提升1.28个BLEU点。
摘要:随着电力用户信息采集系统的发展,更丰富的用户用电信息被用于用户用电信息异常的识别。基于FDI攻击进行虚假数据注入,构造用户用电信息异常数据集,并提出了一种基于召回率的改进Stacking集成分类算法。该算法采用K-近邻算法(k-Nearest Neighbors,KNN)、随机森林模型(Random Forests,RF)、支持向量机(Support Vector Machine,SVM)以及梯度决策树(Gradient Boosting Decision Tree,GBDT)作为Stacking结构的基分类模型;采用逻辑回归(Logistic Regression,LR)作为Stacking结构的元分类模型。并基于召回率为基分类模型的输出结果进行权值赋值,从而作为元分类模型的输入数据集。通过实验验证,所提的基于召回率的改进Stacking集成分类算法相比于传统Stacking集成分类算法拥有更高效的分类性能。
摘要:为了能将庞大的深度学习模型压缩后部署到算力和存储能力有限的设备中时尽可能减小精度损失,对知识蒸馏模型压缩方法进行研究,提出了一种改进后带筛选的多教师模型知识蒸馏压缩算法。利用多教师模型的集成优势,以各教师模型的预测交叉熵为筛选的量化标准筛选出表现更好的教师模型对学生进行指导,并让学生模型从教师模型的特征层开始提取信息,同时让表现更好的教师模型在指导中更具有话语权。在CIFAR100数据集上的VGG13等分类模型实验结果表明,与其他压缩算法相比在最终得到的学生模型大小相同的情况下,精度上有着更好的表现。
摘要:LiDAR技术的发展为自动驾驶提供了丰富的3D数据。然而,由于遮挡和某些反射材料的原因引起信号丢失,LiDAR点云实际上是不完整的2.5D数据,这对 3D 感知提出了根本性挑战。针对这一问题,提出对原始数据进行三维补全的方法。根据大多数物体形状对称且重复率高的特点,通过学习先验对象形状的方法估计点云中遮挡部分的完整形状。该方法首先识别被遮挡和信号缺失影响的区域,在这些区域中预测区域所包含对象形状的占用概率。针对物体间遮挡的情况,通过形状的占用概率和共享同类形状形态进行三维补全。对自身遮挡的物体,通过自身镜像进行恢复。最后通过点云目标检测网络进行学习。结果表明,通过该方法能有效地提高生成点云3D边框的mAP(mean Average Precision)。
摘要:针对在单视图的乳腺肿块检测算法中漏检率和假阳性率较高的问题,提出了一种改进的自动检测算法。将扩张残留网络(Dilated Residual Network,DRN)结合重新设计的特征金字塔网络(Feature Pyramid Network,FPN)用于对乳腺肿块的检测。首先利用DRN中的膨胀卷积,减少对图像的下采样次数;再扩充网络的深度,使其输出满足FPN所需的输入;在FPN结构中,采用注意力机制降低不同特征图直接融合所造成的信息损失,同时采用密集连接代替原有的横向连接,充分融合浅层特征中目标的位置和细节信息。仿真实验显示,所设计的模型在CBSI-DDSM数据集上的检测精度相比于基准模型提升了7.1%。
摘要:针对化工过程中广泛应用的连续搅拌反应釜(CSTR)反应器,提出一种新的基于极限学习机的Hammerstein-Wiener模型的辨识建模方法。其中,Hammerstein-Wiener模型的两个非线性环节采用两个不同的极限学习机逼近,线性环节采用自回归ARX模型。因极限学习机的特殊结构,此模型可以表示成线性回归的形式,最终利用广义最小二乘法求解模型的参数。此方法辨识过程简单,辨识过程的计算量较小。最后对CSTR的辨识结果表明,在相同条件下与基于多项式的Hammerstein 模型和ARX-LSSVM Hammerstein 模型相比,该方法具有较高辨识精度,表明了该方法的有效性。
摘要:为了解决城市中共享单车乱停乱放的问题,提出了一种基于OpenMV的共享单车规范停车系统。系统主要由OpenMV开发板、BC20通信定位模块以及OneNET云服务器等组成。其中OpenMV完成对停车状态的检测与识别,借助BC20内置的网络模块与OneNET云服务器进行数据交互,并将检测结果反馈至小程序客户端,从而实现对共享单车的停车检测和控制。系统通过大量的测试,实验结果表明系统运行稳定,识别准确率为94.1%,可以实现共享单车的规范停车自动检测,具有良好的市场应用前景与价值。
摘要:为解决垃圾网页检测中特征提取难度高、计算量大的问题,提出一种仅基于当前网页的HTML脚本提取语义特征的方法。首先使用深度优先搜索和动态规划相结合的记忆化搜索算法对域名进行单词切割,采用隐含狄利克雷分布提取主题词,基于Word2Vec词向量和词移距离计算3个单页语义相似度特征;然后将单页语义相似度特征融合单页统计特征,使用随机森林等分类算法构建分类模型进行垃圾网页检测。实验结果表明,基于单页内容提取语义特征融合单页统计特征进行分类的AUC值达到88.0%,比对照方法提高4%左右。
摘要:大多数传统的深度学习点云补全学习方法仅仅使用了全局特征而忽略了局部特征,为了更好地提取和使用点云的局部特征,提出了一个基于深度学习的端到端点云补全网络。在点云补全网络(PCN)的基础上,编码部分引入针对局部特征改进的动态图卷积(DGCNN),使用多个不同维度的边卷积提取较为丰富的局部特征,并按照距离弱化远点的特征;然后用深度残差网络连接的思想优化网络结构以实现多尺度特征的融合,并加入平均池化弥补全局池化造成的信息损失;在解码部分引入折叠网络(FoldingNet),使输出的点云更加完整。实验结果表明,该点云补全网络相对PCN等点云补全网络有部分提升,验证了新方法的有效性。
摘要:医疗文本的特征提取及分析在建设临床决策支持系统方面具有较大的实用价值。针对包含各种术语和缩写的原始医疗文本难以提取特征的情况,提出了一种基于BERT与Word2vec的医疗文本分析模型。该模型对医疗病历中关键医疗实体进行识别,基于知识建立权重评分机制,对医学文本进行语义分析。实验数据表明,模型在医疗文本特征提取方面具有一定优势,对高血压性脑出血病历的分析诊断性能良好,能有效应用于临床决策支持系统。
摘要:场景图生成(SGG)任务旨在检测图像中的视觉关系三元组,即主语、谓语、宾语,为场景理解提供结构视觉布局。然而,现有的场景图生成方法忽略了预测的谓词频率高但却无信息性的问题,从而阻碍了该领域进步。为了解决上述问题,提出一种基于增强语义信息理解的场景图生成算法。整个模型由特征提取模块、图像裁剪模块、语义转化模块、拓展信息谓词模块四部分组成。特征提取模块和图像裁剪模块负责提取视觉特征并使其具有全局性和多样性。语义转化模块负责将谓词之间的语义关系从常见的预测中恢复信息预测。拓展信息谓词模块负责扩展信息谓词的采样空间。在数据集VG和VG-MSDN上与其他方法进行比较,平均召回率分别达到59.5%和40.9%。该算法可改善预测出来的谓词信息性不足问题,进而提升场景图生成算法的性能。
摘要:为解决新疆兵团农业现代化建设中有感知无决策的问题,提出一种基于注意力机制模块(SENet)与卷积神经网络混合模型迁移学习的图像分类方法(TL-DA-SE-CNN)。该方法选择4种不同的CNN模型进行权重采集,包括VGGNet、ResNet、InceptionNet和MobileNet。模型使用SENet分类器代替卷积神经网络的全连接层,提取图像的结构性高阶统计特征进行主题分类,并使用BP算法进行参数调整,分类准确度达98.20%。实验结果表明,将CNN与迁移学习、数据增强和SENet相结合的技术提高了牲畜图像分类的性能,是卷积神经网络在农场自动化分群中的有效应用。
摘要:以降低出租车运营损失为目标,分别利用排队论对司机等待的平均时间成本进行量化,以及通过熵值法改进的TOPSIS模型对不同时段载客可能性进行量化,进而完成空载潜在损失参数的量化,通过量化指标构建出出租车运营损失模型,并基于此模型给出了降低损失的运营决策方法。引用洛阳北郊机场航班及出租车数据的验证,证明了该决策方法能够有效降低出租车的运营损失。
摘要:随着目前目标检测任务输入图像分辨率的不断增大,在特征提取网络的感受野不变的情况下,网络提取的特征信息会越来越局限,相邻特征点之间的信息重合度也会越来越高。提出一种FSA(Fusion Self-Attention)-FPN,设计SAU(Self-Attention Upsample)模块,SAU内部结构通过CNN与自注意力机制(Self-Attention)进行交叉计算以进一步进行特征融合,并通过重构FCU(Feature Coupling Unit)消除二者之间的特征错位,弥补语义差距。以YOLOX-Darknet53为主干网络,在Pascal VOC2007数据集上进行了对比实验。实验结果表明,对比原网络的FPN,替换FSA-FPN后的平均精度值mAP@[.5:.95]提升了1.5%,预测框的位置也更为精准,在需要更高精度的检测场景下有更为出色的使用价值。
摘要:针对变压器结构复杂、维护成本高等特点,提出一种基于深度学习的变压器故障信号识别算法。首先分析变压器工作状态下的声纹信号并进行二维图像信号的转换,利用VGG16神经网络在图像中的优势,并在此基础上提出一种MCA注意力机制,该注意力机制能够同时保留背景信息和细节信息;其次对VGG16中的最大池化下采样进行优化,采用一种软池化的采样方法,减少图像中最大池化下采样带来的特征损失;最后为避免过拟合现象的发生,将VGG16顶层结构中的激活函数进行优化,引用可以自归一化的SELU激活函数。实验证明,广义S变换是将一维时域信号转换为二维图像信号的最佳选择,所提算法对于6类故障信号的平均识别率达到99.15%。
摘要:深度神经网络在高维数据的分类和预测中取得了巨大成功。训练深度神经网络是数据密集型的任务,需从多个数据源收集大规模的数据。这些数据中通常包含敏感信息时,使得深度神经网络的训练过程容易泄露数据隐私。针对训练过程中的数据隐私和通信代价问题,提出了一种深度神经网络的分布式训练方法,允许基于多个数据源共同训练深度神经网络。首先,提出了分布式训练架构,由1个计算中心和多个代理组成。其次,提出了基于多代理的分布式训练算法,允许代理在数据不出本地和减少通信代价的情况下,通过切割深度神经网络,实现分布式地共同训练模型。然后,分析了算法的正确性。最后,实验结果表明该方法是有效的。
摘要:为提升普铁接触网检修作业时的安全性以及传输信息的抗干扰性,设计了一套基于人工智能机器人技术加LoRa通信技术的普铁接触网状态监测系统。该系统主要由在作业现场内具有验电、挂接地线与回流线功能的机器人作为数据采集装置和作业现场外对状态信息的传递、处理以及在终端实现可视化监测的模式构成。经过监测模拟测试,机器人数据采集抗干扰结果符合预期,同时LoRa网关与云服务器数据传输正常,PC端可实现监测状态信息可视化查看。
摘要:针对目前网络评论文本情感分类准确性不高的问题,提出一种基于BERT和双向门控循环单元(BiGRU)的改进模型,使用能够表征文本丰富语义特征的BERT模型进行词向量表示,结合能够长期保留文本上下文关联信息的BiGRU神经网络提高模型的分类效果,并在此基础上引入注意力机制,突出文本中更能表达分类结果的情感词权重,提高情感分类的准确率。将上述模型分别在Acllmdb_v1和酒店评论两个公开数据集上进行测试,实验结果表明,该模型在中、英文文本情感分类任务中都获得了良好的性能。
摘要:道路交通标志检测是智能交通的重要环节之一,针对交通标志检测存在背景复杂、目标较小、检测速度慢等问题,选取工业界青睐的YOLOv3模型提出一种改进的检测方法。利用双向特征金字塔结构实现图像低、中、高层特征语意信息的双向融合,提升低层预测目标的分类和高层预测目标的定位能力;将原模型的主干特征提取网络进行改进,提出Darknet23网络,以提高网络的提取能力和减少计算量;根据目标形状的特点,使用K-means聚类算法得到用于训练合适的锚点框,并在边框回归中引入灵活性更强的L_(α-CIOU)损失函数,使网络朝着预测框与真实框重叠度较高的方向去优化。实验结果表明,该方法在CCTSDB数据集上mAP@0.75达到86.10%、mAP@0.5:0.05:0.95达到70.017%,相比原网络分别提升10.17%和5.656%,参数量减少3 622 091,速度提升8.27 f/s,且优于SSD和Faster RCNN等主流的检测网络。
摘要:近年来,随着大数据时代进入人类的生活之后,人们的生活中出现很多无法识别的文本、语义等其他数据,这些数据的量十分庞大,语义也错综复杂,这使得分类任务更加困难。如何让计算机对这些信息进行准确的分类,已成为当前研究的重要任务。在此过程中,中文新闻文本分类成为这个领域的一个分支,这对国家舆论的控制、用户日常行为了解、用户未来言行的预判都有着至关重要的作用。针对新闻文本分类模型参数量多和训练时间过长的不足,在最大限度保留模型性能的情况下压缩训练时间,力求二者折中,故提出基于BERT-CNN的知识蒸馏。根据模型压缩的技术特点,将BERT作为教师模型,CNN作为学生模型,先将BERT进行预训练后再让学生模型泛化教师模型的能力。实验结果表明,在模型性能损失约2.09%的情况下,模型参数量压缩约为原来的1/82,且时间缩短约为原来的1/670。
摘要:在无声或噪声干扰严重的环境下,或对于存在听觉障碍的人群,唇语识别至关重要。针对词语级中文唇语识别的问题,提出了SinoLipReadingNet模型,前端采用Conv3D+ResNet34结构用于时空特征提取,后端分别采用Conv1D结构和Bi-LSTM结构用于分类预测,并引入Self-Attention、CTCLoss对Bi-LSTM后端进行改进。最终在新网银行唇语识别数据集上进行实验,结果表明,SinoLipReadingNet模型在识别准确率上明显优于中科院D3D模型,多模型融合的预测准确率达到了77.64%,平均字错率为21.68%。
摘要:为了解决常见目标检测算法在课堂场景中难以有效应用的问题,提出了一种融合轻量化与梯形结构的学生行为检测算法。该算法基于YOLOv4架构,针对目标分类和分布空间的特点,提出一种新的“梯”形特征融合结构,并结合MobileNetv2思想,优化模型参数得到梯形-MobileDarknet19特征提取网络,既减少了网络的计算量,提高了工作效率,同时加强了目标特征的信息传输,提升了模型学习能力;在尺度检测阶段引入5层的DenseNet网络,增强网络对小目标的检测能力。实验结果表明,提出的YOLOv4-ST算法相比于原YOLOv4算法mAP提高了5.5%,相比于其他主流算法,在学生课堂行为检测任务中具有较好的实用性。
摘要:在复杂的靶场试验场景中,试验现场常常涉及扬尘、强光、遮挡等多变的自然环境。针对这种情况下快速运动的目标物体跟踪,提出了一种关联动态特征的单目标跟踪算法。首先使用门控循环单元(Gated Recurrent Unit,GRU)提取待跟踪目标的时序动态特征,获得候选处理目标框集合;然后利用卷积网络(Convolutional Neural Network,CNN)提取候选目标框的深度卷积特征并确定目标位置,同时分离出背景卷积特征;在跟踪过程中,使用分离出的背景卷积特征图对网络进行参数更新,增强网络的鲁棒性与自适应性。实验结果表明,所提出的算法可以对靶场图像采集系统中的被试移动目标进行自适应跟踪,并且在复杂环境背景下算法仍能保持优异的鲁棒性与适应性。
摘要:实体对齐是实现对不同来源知识库进行融合的重要技术方法,在知识图谱、知识补全领域具有广泛应用。现有基于图注意力的实体对齐模型多使用静态图注意力网络且忽略了实体属性中的语义信息,导致模型存在有限注意、难以拟合、表达能力不足等问题。针对这些问题,开展基于动态图注意力结构建模实体对齐方法研究,首先使用图卷积层建模目标实体的单跳节点表示,其次应用动态图注意力网络获得多跳节点注意力系数并建模,再次利用逐层门控网络聚合图卷积层与动态图注意力层输出的单跳、多跳节点信息,最后拼接通过外部知识预训练自然语言模型提取的实体名称属性嵌入并进行相似度计算。该方法在DBP15K的三类跨语言数据集中都获得了一定的提高,证明了应用动态图注意力网络与融入实体属性语义在提高实体表示能力上的有效性。
摘要:随着各工业领域的快速发展,市场对薄规格、高强度板带产品的需求快速增加。而热轧板带横断面形状是热轧板带产品质量的主要评价指标。基于数据挖掘技术,对轧机数据库中的数据进行分析与处理,其中数据挖掘技术采用深度置信网络(Deep Belief Neural,DBN)和BP(Back Propagation)算法相结合,构建板带横向厚度分布的预测模型。DBN-BP算法由多个限制玻尔兹曼网络(Restricted Botlzmann Machine,RBM)逐层堆叠而成,并使用无监督的逐层训练的方式得到网络的权值矩阵和偏置供BP算法使用,而BP算法通过误差反向传播的方式对整个网络进行微调。该方法克服了BP算法因随机初始化权值参数而陷入局部最优和训练时间长的缺点。通过与BP算法相比较可知,采用DBN-BP方法预测终轧道次稳定轧制时板带中点厚度误差在±5.6 μm范围内的概率可达95%;而BP算法的预测误差范围为±11 μm。并且通过对板带横断面形状的预测结果分析可知,相比于BP算法,DBN-BP深度学习方法对于板带边部厚度的预测更具有优势。
摘要:情绪与人类的行为、家庭及社会密切相关。情绪不仅能反映人类的各种感觉、思想和行为,而且也是各种外部刺激所产生的心理和生理反应,所以在很多领域中对情绪的正确识别十分重要。情绪的变化会导致脑电图(EEG)信号发生变化,反之,这些变化也反映了情绪状态。基于DEAP数据库,对EEG信号进行时域特征和频域特征提取,通过PCA主成分分析法对特征进行降维处理。利用加权KNN算法进行5折交叉验证训练,最终对兴奋(excited)、放松(relaxed)、沮丧(depressed)、愤怒(angry)4种情绪状态的识别准确率达到80%。
摘要:在信息化战争中,人机交互在指挥控制装备中的应用日益广泛。采用语音识别方式代替键盘、旋钮、按键等方式更改电台参数,使其操作更智能化、更便捷。本系统将LD3320语音识别芯片采集到的语音进行处理,通过主控芯片STM32F407发送相关协议控制电台的系列操作。通过实验表明,该系统在语音识别识别率达到95%左右,能实现对电台的改频、开关等操作。
摘要:局部放电是设备处于高电场强下,由于电场分布不均而导致的绝缘介质放电现象,设备产生局部放电对于绝缘层的危害很大,迅速检测识别设备的放电类型是工业正常运作的保障。针对电气设备局部放电类型识别问题,考虑到电气设备监测系统在诊断识别方面的时效性及精度,提出了基于边缘计算的局部放电模式识别方法,利用边缘计算架构的优势,基于云层训练、边缘推理思路,将复杂的识别算法训练优化过程部署在云层,将计算量大的识别算法卸载到边缘层,而计算量小的特征提取保留在终端设备层处理。通过构造局部放电相位分布谱图提取局部放电的统计特征参数,采用粒子群优化算法对广义回归神经网络模型进行优化,最后将统计特征参数作为神经网络的输入量,对放电类型进行识别。结果表明,所提模式识别方法识别准确率高,识别效率高。
摘要:现有的基于图神经网络的推荐算法能够利用图结构信息使得推荐效果得到较好的提升,但主要的图结构都是围绕着用户和项目的一种交互,却忽略了用户的多种行为,如点击、收藏、分享、加入购物车等都表达着用户不同的语义;又如评论信息,可能影响着该类型物品的下一次购买意图。为此提出一种基于用户行为和评论信息的图神经网络推荐算法,算法通过图卷积网络学习用户行为的强度及语义,再利用评论文本图表示学习评论中用户和商品的偏好,最后进行融合提升推荐效果。实验结果表明,该算法对于推荐效果有一定的提升。
摘要:随着电动汽车规模化发展,充电站负荷对电网造成一定影响,为保障电网平稳运行,提出一种基于极端梯度提升(eXtreme Gradient Boosting,XGBoost)与轻量级梯度提升机(Light Gradient Boosting Machine,LightGBM)融合的电动汽车充电负荷预测模型。该方法运用Stacking集成学习的策略:首先根据时间特征与历史负荷数据采用XGBoost与LightGBM算法构建负荷预测的基学习器,然后采用岭回归(Ridge Regression,RR)算法将基学习器的输出结果进行融合之后输出负荷预测值。为了对比多种不同的负荷预测模型,采用上海市嘉定区的充电站订单数据进行试验,结果表明,该方法所构建的负荷预测模型相比单一算法模型具有更高的预测准确度,对电网平稳运行有一定理论及实用价值。
摘要:对基于极化SAR影像的地物分类技术发展进行归纳与总结。首先提出地物分类技术的价值需求和应用特点,对其所要解决的科学问题进行归纳;其次总结分析极化SAR影像分类的一般技术流程;进一步对国内外研究现状与技术算法特点进行分类梳理,提出其在理论方法与地物分类应用中的技术优缺点,尤其对基于人工智能理论的极化SAR影像地物分类技术进行探讨;最后结合SAR遥感的发展趋势,指出未来极化SAR影像地物智能分类技术的研究方向。
摘要:随着车联网的快速发展,车载应用大多是计算密集和延迟敏感的。车辆是资源受限的设备,无法为这些应用提供所需的计算和存储资源。边缘计算通过将计算和存储资源提供给网络边缘的车辆,有望成为满足低延迟需求的有效解决方案。这种将任务卸载到边缘服务器的计算模式不仅可以克服车辆资源的不足,还可以避免将任务卸载到云可能导致的高延迟。提出了一种基于深度强化学习的任务卸载方法,以最小化任务的平均完成时间。首先,把多任务卸载决策问题规约为优化问题。其次,使用深度强化学习对优化问题进行求解,以获得具有最小完成时间的优化卸载策略。最后,实验结果表明,该方法的性能优于其他基准方法。
摘要:目标检测算法在视频监控领域有着较大的实用价值。针对当前在资源受限的视频监控系统中实现实时目标检测较为困难的情况,提出了一种基于YOLOv3-tiny改进的目标检测算法。该算法在YOLOv3-tiny架构的基础之上,通过添加特征重用来优化骨干网络结构,并提出全连接注意力混合模块来学习到更丰富的空间信息,更适合资源约束条件下的目标检测。实验数据表明,该算法相比于YOLOv3-tiny在模型体积降低39.2%,参数量降低39.8%,且在VOC数据集上提高了2.7%的mAP,在提高检测精度的同时显著降低了模型资源占用。
摘要:针对临床医生在诊断肝包虫病时需要通过个人经验判断囊型肝包虫病分型,研究基于目标检测算法的肝包虫病灶自动检测与分类模型,实现对肝包虫病超声影像的自动识别与分类。使用YOLOv5l模型作为囊型肝包虫病病灶目标检测的模型,利用本地肝包虫病超声影像数据集对网络模型进行训练。基于YOLOv5l模型与随机梯度下降算法(SGD)优化算法的肝包虫病病灶自动检测分类模型可以很好地对5种类型的病灶进行有效的检测,平均精度均值(mAP)为88.1%,经过测试,该模型的测试速度可达40 f/s。实验结果表明,基于YOLOv5l与SGD算法的肝包虫病病灶自动检测分类模型能够较好地识别病灶的具体位置,可以很好地辅助医生诊断肝包虫病。
摘要:车辆属性检测是一个基础任务,其属性检测结果可以被应用到很多下游的交通视觉任务。提出了一种基于YOLOv5的车辆属性检测改进算法。针对检测目标较小的问题,加入了卷积注意力模块,让网络模型把更多的注意力放在小目标对象上;针对数据集样本种类较少的问题,改进了YOLOv5的马赛克数据增强方式;使用自门控激活函数Swish,起到抑制噪声、加快收敛速度并提升模型鲁棒性的作用。此外,还在公开车辆数据集VeRi-776的基础上进行了详细的车辆属性标注,构建了一个车辆属性数据集。实验结果表明,改进后的算法比原始YOLOv5的平均精确率提升了4.6%,能够准确地检测到车辆图像的通用属性,可以供下游任务使用。
摘要:癌症患者的激增引起了全世界的关注,许多研究者将目光放在了对化合物致癌性的评估上,但这是一项极其具有挑战性的任务。本实验获取了341种实验数据,利用三维图卷积网络(SGCN),建立了对化合物致癌性的预测模型。结果表明:对化合物进行致癌性预测的SGCN分类模型准确率高达96.9%,比其余模型效果更好,这表明SGCN模型能够准确地对化学品进行分类,并且在实际应用中具有相当大的潜力。
摘要:现有的空气质量预测方法很少考虑季节性因素,且预测的效果不佳,因此提出一种基于改进二元混沌乌鸦搜索算法(Binary Chaotic Crow Search Algorithm,BCCSA)和深层长短期记忆神经网络(Long Short Term Memory,LSTM)的空气质量预测方法。首先提出季节调整的方法对收集的原始空气质量数据进行预处理,以消除季节对预测的影响;然后提出改进BCCSA,对空气质量数据进行优化处理;最后,将自注意力机制加入到深层LSTM中,对空气质量数据进行预测。实验结果表明,该方法能有效地提高空气质量的预测精度。
摘要:针对脑电信号(EEG)运动想象分类过程中弱相关特征量影响分类准确度的问题,提出一种筛选方法,该方法是基于α波和主成分分析(PCA)算法的。基于脑机接口(BCI)系统,通过听觉诱发刺激产生向左和向右两种运动想象任务对应的脑电信号,并对其做小波包分解处理,然后进行脑电α频段信号的重构,从而提取出α波形并对其进行统计特征提取。再结合PCA技术和支持向量机(SVM)方法,实现弱相关特征的剔除和特征分类。根据筛选后的数据进行分类,所得结果准确率更高,信号分类的准确度由90.1%提高至94.0%。
摘要:随着近年来人机语音交互场景不断增加,利用麦克风阵列语音增强提高语音质量成为研究热点之一。与环境噪声不同,多说话人分离场景下干扰说话人语音与目标说话人同为语音信号,呈现类似的时、频特性,对传统麦克风阵列语音增强技术提出更高的挑战。针对多说话人分离场景,基于深度学习网络构建麦阵空间响应代价函数并进行优化,通过深度学习模型训练设计麦克风阵列期望空间传输特性,从而通过改善波束指向性能提高分离效果。仿真和实验结果表明,该方法有效提高了多说话人分离性能。
摘要:城市交通日益拥堵的今天,为用户推荐最快行驶路线成为一个研究热点。行驶路线推荐的核心问题是对路线将来某段时间(途径这段线路时)交通状况的预测。交通状况受到路线本身状况、行驶时间、天气状况、驾驶员习惯等多种因素影响,其变化快、变化方式复杂,难以准确预测。对多阶马尔可夫链模型进行了改进,提高了运算效率和响应速度,建立一种高效的交通状况预测模型,经北京市实际交通数据的检验,得到了比较好的预测效果。
摘要:佩戴口罩可以有效预防病毒的传播,为减少通过人工方式检查口罩佩戴情况所消耗的大量人力资源,提出一种基于深度学习的口罩佩戴检测与跟踪方法,该方法分为检测和跟踪两个模块。检测模块在YOLOv3网络的基础上引入空间金字塔池化结构,实现不同尺度的特征融合;然后将损失函数改为CIoU损失,减少回归误差,提升检测精度,为后续跟踪模块提供良好的条件。跟踪模块采用多目标跟踪算法Deep SORT,对检测到的目标进行实时跟踪,有效防止重复检测,改善被遮挡目标的跟踪效果。测试结果表明,该方法的检测速度为38 f/s,平均精度值达到为85.23%,相比原始YOLOv3算法提高了4%,能达到实时检测口罩佩戴情况的效果。
摘要:针对水下机器人对于探测海洋具有的高灵敏度、低成本、易携带特点的要求,设计和实现面向水下目标的双目视觉测距检测方法。采用张正友标定算法,通过使用9×9棋盘获取水下双目相机的内外矩阵模型的参数,采用SGBM(Semi-Global Block Matching)立体匹配算法,增强了图像的对比度,削弱了图像色斑的影响,保证了算法的鲁棒性,提升了匹配搜索速度。将视差图通过矩阵运算转化成深度图,并将其映射成可视化点云,构建目标物体的三维立体信息。
摘要:推荐效率低、推荐质量有待提高等问题普遍存在于传统协同过滤推荐算法中,为了改善并解决这些问题,在协同过滤推荐算法中将混合聚类与用户兴趣偏好融合,经过验证推荐质量有显著提升。首先根据用户的个人相关信息构建Canopy+bi-Kmeans的一种多重混合聚类模型,采用提出的混合聚类模型把所有用户划分成多个聚类簇,将每个用户的兴趣偏好融合到生成的聚类簇中,形成新的相似度计算模型;其次利用基于TF-IDF算法的权重归类方法计算用户对标签的权重,并使融入时间系数的指数衰减函数捕捉用户兴趣偏好随时间的变化;最后使用加权融合将用户偏好和混合聚类模型相结合,匹配到更相似的邻居用户,计算出项目评分并进行推荐。利用公开数据集对比实验证明,提出的方法能够提高推荐质量和推荐可靠性。
摘要:随着船舶智能化水平提高,船载远程会议系统对提高应急处理能力、推进船岸一体化网络建设有重要意义,麦克风阵列是保证远程会议系统语音效果和支持多模态交互的重要语音前端。但船舶舱室狭小尺寸一方面导致只能采用小尺寸麦阵,另一方面小舱室导致的强混响以及嘈杂舱室噪声也使传统麦克风阵列算法性能严重下降。考虑船舶舱室复杂环境下小尺寸麦阵DOA估计场景,提出了一种轻量级Mask-DOA估计神经网络模型。该方法在DOA估计神经网络引入Mask算法降低噪声和混响的干扰,并提取增强后的GCC-PHAT作为网络特征,从而在小尺寸麦阵上实现高精度DOA估计。仿真和实验结果表明,所提出的Mask-DOA模型面对复杂的船舶舱室环境更鲁棒,泛化能力更强。
摘要:交通标志在车辆的安全行驶和自动驾驶中都有着大量的研究。由于交通标志的种类繁多且受各种因素的影响,交通标志的分类检测也是一个具有挑战的难题。为此,提出了一种标签结合现实道路场景的交通标志分类检测方法,该方法分为数据生成部分和目标检测部分。实验结果表明,利用该方法生成训练数据,能够有效地训练深度卷积神经网络,实现现实场景交通标志的分类检测,并且优化的检测模型相比文中提到的模型具有更小的体积和更快的速度。
摘要:电磁导引是一种车辆自动导引方案,广泛应用于工业、物流等领域。为解决现有电磁导引方案对车辆机械结构要求较高、易受传感器预瞄距离短的限制、难以应用于小型自动导引车辆的问题,提出了一种基于全连接神经网络的导引方案。通过数据分析寻找有限预瞄距离内的最优传感器排布方案,设计和训练全连接神经网络模型,对车身姿态及车后道路的信息进行全面预测,以弥补传感器短预瞄所造成的前向道路探测能力的不足。经模拟和实际测试,该方案能极大改善较小体积车辆的短预瞄电磁导引系统的控制效果,实现车辆的稳定快速运行。
摘要:当前使用门控循环单元(Gated Recurrent Units,GRU)神经网络进行流量预测时,普遍存在滞后性以及预测准确性不高的问题,因此提出一种改进的GRU模型进行流量预测的方法。首先基于GRU神经网络提出一种双向GRU神经网络和人工神经网络堆叠的网络模型,适用于流量特征、时间特征、事件特征等多维向量的输入;同时为解决部分时间段准确度不高的问题,将训练样本进行日期分类,针对每一类日期生成单独的网络模型,能大幅提升预测的准确度以及改善预测的滞后性。最后,为了提升流量峰值的预测准确度,采用样本的再平衡手段以及自定义损失函数,实验结果表明,能较好地达成预期目标。
摘要:互联网对人民群众的生活和工作产生了重要影响,然而网络空间中隐藏着大量有害的博彩网站或赌博网站,很容易给网民造成损失和困扰,甚至可能扰乱社会秩序,因而研究对此类网站进行高效识别的方法具有重要意义。提出利用深度残差神经网络解决博彩类网页识别问题,基于深度残差网络的原理设计了算法GamblingRec。经验证,算法准确率达到了95.16%,正样本召回率为93.21%,表明基于深度残差神经网络的方法能够用于博彩类网页识别,并能达到较高的识别性能。
摘要:针对当下球类陪练机器人人机交互能力不足的问题,提出一种基于树莓派和YOLOv5目标检测算法的新型人机交互模式,使机器人实现前进、后退、左移、右移、抛球、踢球6种不同的动作;通过对在3种不同环境(室内、室外晴天、室外阴天)下搜集的人体姿态数据集进行标定、训练后,得到6种姿态在3种环境中测试集上的识别准确率分别为:室内96.33%、室外晴天95%、室外阴天94.3%。相比基于特征匹配和其他利用手势等小目标检测的算法,基于该算法的机器人具有更高的检测速度和准确性,使机器人更加智能化。
摘要:针对生活垃圾的高效分类及搬运处理,设计了一款以边缘嵌入式AI设备Jetson Nano为控制器的光电智能小车系统,该系统设计以YOLOv5为目标检测算法,以Pytorch1.8.1为深度学习框架。使智能小车从指定区域出发,通过自身的光电传感器在指定范围内搜寻垃圾,利用六轴机械臂对垃圾进行分拣并送到指定分类地点。对采集到的5 048张图片(包括5种垃圾类别)进行300次的迭代训练,实验测试结果表明:平均精确度达到91.8%,准确率达到94.5%,召回率达到89.03%。
摘要:近年来,如何通过人工智能对人的面部表情进行识别分析成为一个研究热点,利用人工智能可以快速地分析人的面部情绪,并以此为基础进行进一步研究。在深度学习中,传统的卷积神经网络存在对面部表情特征的提取不充分以及计算机参数量较大的问题,导致分类准确率较低。因此,提出了基于VGG16网络的人脸表情识别算法,通过与InceptionV3、InceptionResNetV2、ResNet50等模型实验对比,结果表明,VGG16神经网络在FER2013PLUS测试数据集上的识别准确率为79%,准确率比传统的卷积神经网络高。
摘要:在自动检测中,由于道路损伤数据集存在小目标损伤难检测与类别不平衡问题,导致道路损伤检测的准确率低、虚假率高。为此,在DSSD(Deconvolutional Single Shot Detector)网络模型的基础上,提出一种结合注意力机制和Focal loss的道路损伤检测算法。首先,采用识别精度更高的ResNet-101作为DSSD模型的基础网络;其次,在ResNet-101主干网络中添加注意力机制,采用通道域注意力和空间域注意力结合的方式,实现特征在通道维度上的加权与空间维度上的聚焦,提升对小目标道路损伤的检测效果;最后,为了减少简单样本的权重,增大难分类样本的权重,使用Focal loss来提高整体的检测效果。在Global Road Damage Detection Challenge比赛所提供的数据集上进行验证,实验结果表明,该模型的平均精度均值为83.95%,比基于SSD和YOLO网络的道路损伤检测方法的准确率更高。
摘要:针对公共政策的语义分析对比是行政管理重要的研究方向,随着深度学习、知识图谱应用越来越广泛,任何在这一领域改进技术方法的尝试都可能带来较大的进步。将自然语言理解相关技术应用于产业政策研究有利于政策的制定与管理。针对软件产业政策提出一套基于自然语言理解的技术分析方法,旨在构建政策之间的关联关系网络,以期辅助政府决策。
摘要:由于多源传感数据及其噪声构成复杂的非线性可分空间,数据融合是目前在资源受限的传感网络中安全、准确和高效地消除冗余数据的重要方法。结合SVM泛化能力强、凸优化的特点,侧重分析了非线性可分多源数据集转化为高维线性可分空间的可行性方法。仿真实验结果表明,宽度参数范围预估方法可以加速高斯核宽度参数的确定。针对多分类情形,仿真实验结果表明,通过控制误差积累,更能确保分类的有效性。
摘要:介绍了中国移动IT云针对IaaS层的智能运维场景体系规划,选择了数据基础较好的两个典型应用场景“智能化指标异常检测”和“智能化告警关联与溯源”进行了研究和论证,分别分析了两个场景适用的算法和实现过程,论述了两个场景实施后的效果评估方法,并经实际生产验证了场景实施的效果。
摘要:基于深度学习的目标检测算法因其模型复杂度和对计算能力的要求,难以部署在移动设备等低算力平台上。为了降低模型的规模,提出一种轻量级目标检测算法。该算法在自顶向下的特征融合的基础之上,通过添加注意力机制构建特征金字塔网络,以达到更细粒度的特征表达能力。该模型以分辨率为320×320的图像作为输入,浮点运算量只有0.72 B,并在VOC数据集上取得了74.2%的mAP,达到了与传统单阶段目标检测算法相似的精度。实验数据表明,该算法在保持了检测精度的同时显著降低了模型运算量,更适合低算力条件下的目标检测。
摘要:考虑到当前电力行业仍缺少有效的领域词发现方法,以电力行业科技项目文本为原始语料库,将基于互信息与左右熵的统计特征与传统语言构词规则特征相融合,提出了电力文本成词率的概念。所提方法首先利用成词率对电力文本进行无监督筛选得到初始候选词集,然后对候选词集进行文本切片算法和常用词过滤操作,最后进行词嵌入和谱聚类得到最终所需的电力文本领域词。实验结果表明,所提出的方法准确有效,为电力文本的领域词发现提供了一种新方法。
摘要:针对Staple算法在由于相机运动出现模糊情况下跟踪精度下降的问题,提出一种基于背景权重直方图的改进Staple目标跟踪算法。首先,针对传统颜色直方图忽略空间性的问题,提出对直方图引入位置权重;其次,利用背景区域颜色直方图抑制背景信息对目标区域直方图的影响,提出引入背景权重直方图,并完成直方图分类器的构建。该算法在OTB2015测试集上与其他5个先进算法进行实验比较,结果表明在距离精度和成功率上总体效果相对Staple分别提升了3.7%和2%。
摘要:实时监测功率变流器中支撑电容的老化状态,及时发现并更换存在缺陷的电容,对提高功率变换器的可靠性具有重要意义。基于相关电压电流数据,通过建立数据集,确定网络模型参数和模型训练,最终得到基于CNN-LSTM的神经网络模型,并通过不同工况下的数据集对神经网络模型的准确性进行了验证。结果表明,该模型可对电容容值进行可靠预测。
摘要:为了满足人们对更好解锁方式的需求,提出了一种基于语音指令的电子门锁解锁方法及系统。该方法的设计理念是:利用手机号码的唯一性识别用户身份;利用语音识别技术,实现利用不同的语音指令打开不同门锁。该系统由电子门锁、手机和互联网服务器组成。对该方法及系统进行了详细设计和说明,据此即可进行代码编写、电路设计等产品化设计工作。基于本方法及系统的电子门锁适用范围宽、解锁便捷,并具有更好的安全性、更高的性价比,对电子门锁或智能门锁行业的发展将会产生重要影响。
摘要:基于上交所主板市场A股企业的财务指标数据来预测企业的财务风险,样本数据包括1 227家正常上市企业和42家被财务预警的企业,数据严重不平衡,通过重采样技术解决了分类器在不平衡样本中失效的问题,运用Bagging思想的集成机器学习对预测模型进行提升与优化。正确挑选出有财务危机企业的概率最高达到92.86%,在此基础上,样本的整体准确率在经过模型的集成之后提高了5.4%。集成模型提高了对上市企业的财务预警能力,能为企业的正常经营和投资者的安全投资提供一定的借鉴。
摘要:针对人工阅片工作量大、阅片质量不佳且容易出现漏检、错判等问题,将Faster RCNN目标检测模型应用于肝包虫病CT图像的检测,并对目标检测模型进行改进:基于图片分辨率低、病灶大小不同的特点,使用网络深度更深的残差网络(ResNet101)代替原来的VGG16网络,用以提取更丰富的图像特征;根据目标检测模型得出的病灶坐标信息引入LGDF模型进一步对病灶进行分割,从而辅助医生更高效的诊断疾病。实验结果表明,基于ResNet101特征提取网络的目标检测模型能够有效提取目标的特征,检测准确率相比原始检测模型提高2.1%,具有较好的检测精度。同时,将病灶坐标信息引入LGDF模型,相比于原始的LGDF模型更好地完成了对肝包虫病病灶的分割,Dice系数提高了5%,尤其对多囊型肝包虫病CT图像的分割效果较好。
摘要:特征工程可以自动地处理和生成那些判别性高的特征,而无需人为的操作。特征工程在机器学习中是不可避免的一环,也是至关重要的一环。提出一种基于强化学习(RL)的方法,将特征工程作为一个马尔可夫决策过程(MDP),在上限置信区间算法(UCT)的基础上提出一个近似的方法求解二分类数值数据的特征工程问题,来自动获得最佳的变换策略。在5个公开的数据集上验证所提出方法的有效性,FScore平均提高了9.032%,同时与其他用有限元变换进行特征工程的方法进行比较。该方法确实可以得到判别性高的特征,提高模型的学习能力,得到更高的精度。
摘要:随着信息技术的发展,人脸识别在支付、工作和安防系统中应用的越来越多。在边缘计算系统中,为了处理的速度,通常选择较小的神经网络进行人脸识别,这样会导致识别率低。并且在实际应用中大多都是对于图片质量较高的人脸可以很好地识别,但对于受光照影响较大、表情和姿态变化大的图片识别率不是很高。因此,选择SqueezeNet轻量级网络,该网络层数小,可以很好地运用于边缘计算系统中。采用了预处理的方法来对图片进行预处理,然后改进了SqueezeNet网络的损失函数以及加入了ResNet网络中的残差学习方法。最后通过对LFW和IJB-A数据集进行测试,该研究方法明显提高了识别率。
摘要:通信技术的普及给人们带来便捷的同时,电信欺诈行为也急剧增加。由于诈骗行为特征、号码类型等与正常业务具有极高相似性,传统基于统计的电信欺诈检测方法难于筛选。提出将用户通信关系转换为一组拓扑特征,建立通信社交有向图,将具有统计特征的顶点表示用户,具有关系特征的边表示他们之间的活动。在通信社交图基础上,通过图卷积模块捕获用户的通信行为规律和通信社交关系特征,通过池化读出机制聚合通信社交网络的潜在特征,以识别电信欺诈行为。真实通信历史数据验证表明了该方法的有效性。
摘要:边缘设备的快速发展和深度学习的落地应用越来越多,两者结合的趋势越发明显。而针对低功耗边缘设备AI应用的潜力还未完全开发出来,大量设备隐藏着大量计算能力,释放其潜力所带来的社会效益和经济效益是非常明显的。因此,以目标检测任务中较为常见的人脸检测为例,将MTCNN人脸检测算法改进并移植到资源极其紧张的低功耗嵌入式平台,在一定环境条件下,最终成功地检测到人脸,并绘制出人脸候选框,结合舵机云台具备了一定的人脸跟踪能力。
摘要:计算机通信网络技术高速发展,日新月异,随之涌现的网络攻击、破坏现象形态各异、层出不穷。态势感知系统为网络安全提供了全面保障,提高态势评估和态势预测建模的稳定性、精准性和快速性是态势感知系统研究的重要方向。深度信念网作为一种深度学习智能算法,为网络安全态势评估和态势预测的精确性、理论化带来新方向。考虑深度信念网算法采用受限玻尔兹曼机作为基础网络,逐层预训练和微调为网络核心部分。构建广义网络安全态势评估指标体系,并建立计算机通信网络安全的态势评估和态势预测数据驱动模型。通过入侵检测数据集CIC-IDS2017进行实验仿真,验证了该模型的精准性和有效性。
摘要:针对微博网络舆情信息量大、无规则、随机变化的特点,提出TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes)用于微博情感分析,设计与实现了一个基于Scrapy框架的微博评论爬虫,将某热点事件的若干条微博评论进行爬取并存进数据库,然后进行文本分割、LDA(Latent Dirichlet Allocation)主题聚类,最后使用TFIDF-NB算法进行情感分类。实验结果表明,TFIDF-NB算法平均准确率高于线性支持向量机算法和K近邻算法,在精确率和召回率方面高于K近邻算法,具有较好的情感分类效果。
摘要:Tor是一种基于洋葱路由通信协议建立的隐蔽加密通信系统。该系统基于互联网现有路由、数据加密等协议,构建了一套保护通信实体的身份隐匿机制,使得经过Tor网络传播的数据难以被有效追踪和分析。然而近年来这项隐蔽通信技术被罪犯大量使用,已成为网络犯罪和非法交易的温床。为有效应对该问题,提出一项基于机器学习的Tor网络识别检测技术,通过主动生成Tor网络流量,基于机器学习技术实施流特征提取与检测,从而发现参与Tor通信的网络实体及其通信类型,进而检出潜在的恶意暗网用户。实验表明,该方法可有效识别Tor通信实体以及通信行为,如电子邮件和FTP应用等。
摘要:卷积神经网络在各个领域都发挥着重要的作用,尤其是在计算机视觉领域,但过多的参数数量和计算量限制了它在移动设备上的应用。针对上述问题,结合分组卷积方法和参数共享、密集连接的思想,提出了一种新的卷积算法Group-Shard-Dense-Channle-Wise。利用该卷积算法,在PeleeNet网络结构的基础上,改进出一种高效的轻量化卷积神经网络——GSDCPeleeNet。与其他卷积神经网络相比,该网络在具有更少参数的情况下,几乎不损失识别精度甚至识别精度更高。该网络选取1×1卷积层中卷积核信道方向上的步长s作为超参数,调整并适当地选取该超参数,可以在网络参数量更小的情况下,拥有更好的图像分类效果。
摘要:基于软硬件协同设计的思想,利用HLS工具,在PYNQ-Z2平台上设计并实现了一个卷积神经网络加速器,对卷积运算采用矩阵切割的优化方法,均衡了资源消耗和计算资源,使得加速器的性能达到了最优。利用MNIST数据集对加速器IP核进行性能测试,实验结果表明:对单张图片的测试,该加速器相对于ARM平台实现了5.785的加速效果,对于1 000张图片的测试则可达到9.72的加速效果,随着测试图片数量的不断增加,加速器的性能也将越来越优。
摘要:针对汽车造型智能设计领域中如何有效提取用户需求的问题,提出一种融合多特征TFIDF(词频-逆向文件频率)文本分析的汽车造型需求提取方法。首先,通过基于互信息与边界自由度获取大量未登录的专业词汇,优化和修正简单分词后的词汇;然后针对经典TFIDF算法的局限性,引入词汇特征因素与情感特征因素,获取用户需求特征候选集;最后根据设定的阈值得到有效的用户需求。实验结果表明,融合多特征TFIDF文本分析算法在特征提取方面有一定优势,能有效提取文本中关于汽车造型的用户需求。
摘要:群体智能在解决非确定性多项式(NP)问题或搜索空间过大的问题时有着显著优势。将鸽群优化(Pigeon Inspired Optimization,PIO)算法应用于入侵检测系统的特征选择中。提出基于Sigmoid的PIO(SPIO)和基于Cosine余弦相似度的PIO(CPIO)算法对入侵检测数据集KDDCUP99进行特征选择,并用机器学习的方法进行实验,建立模型并评估结果。
摘要:缺陷检测对于古建筑的保护和修缮具有重要的意义,传统的地砖缺陷检测通过目视检查,存在受人力影响大、耗时长等限制。基于深度学习的良好应用前景,建立故宫地砖缺陷的数据集,提出改进型Faster R-CNN的网络。首先,构建可变形卷积,通过网络学习并提取地砖中的缺陷特征;然后,将特征图输入区域生成网络中生成候选区域框,将生成的特征图和候选区域框进行池化操作;最后,输出缺陷检测结果。在故宫地砖图片数据集的测试下,改进后的模型平均准确率均值到达92.49%,与Faster R-CNN模型相比提高了2.99%,更适用于地砖缺陷检测。
摘要:深入分析了当前倒车影像系统在实际使用场景上的不足,介绍了雷达存在的辐射面有限、角度盲区、物体识别方面的缺陷,以及毫米波雷达的高成本难以普及应用。提出了基于ADAS的汽车倒车防碰撞系统设计,对系统倒车功能做了深入的原理分析,针对基于倒车摄像头图像分析的ADAS算法详细介绍了其技术关键点和基于倒车场景融合特征的创新应用,算法识别效果精准有效。针对不同车辆摄像头安装位置和朝向的差异创新设计了灵活的预警和报警区域的调节功能,结合TTS语音提醒和图文显示提醒司机采取合适的操作保障行车安全,极大地改善了该倒车防碰撞系统的用户体验和实际作用,为司机的安全行车提供了有力保障。
摘要:提出基于分块LBP-TOP(Local Binary Patterns from Three Orthogonal Planes)特征和改进的加权稀疏表示分类解决微表情识别与专用线车辆状态检测问题。首先利用LBP-TOP特征描述符对从分块图像中选择出的有效块进行提取特征,将提取的特征作为字典,采取加权稀疏表示(Weighted Sparse Representation,WSRC)和对偶增广拉格朗日乘子法(Dual Augmented Lagrange Multiplier,DALM)相结合的算法(WSRC_DALM)进行稀疏表示分类;然后利用不同尺寸的块划分图像,选择有效块提取特征,特征融合后参与分类。在CASME Ⅱ与SAMM表情数据库上采用“留一人交叉验证”(Leave One Subject Out, LOSO)的分类方法进行5分类,得到的识别率分别达到了77.30%与58.82%,在车辆状态检测检测数据库上的实验达到了84.60%的检测率。实验结果表明了所提出算法的有效性。
摘要:雨线造成的图像质量退化严重影响图像有效应用及计算机视觉算法,因此图像去雨十分必要。目前主流的深度学习去雨方法仅对单一尺寸的雨线有效,并且存在雨线去除不完全、模糊背景等问题。针对以上难点,提出了基于深度密集连接控制网络的单幅图像去雨算法。通过引入多尺度特征网络加强对不同尺寸雨线的提取能力,引入注意力机制模块提升对有雨区域的关注度,引入密集连接控制网络以完整表示雨线特征。实验表明,该方法在合成数据集以及真实数据集对比主流去雨方法效果均有提升。
摘要:皮肤病是医学上的常见的、多发性疾病,因此皮肤检测技术越来越受关注。卷积神经网络是常见的皮肤检测方法,其模型结构会丢失很多信息。CapsNet(胶囊网络)是在卷积神经网络之后的一种新的神经网络。CapsNet的矢量化特征能够较好地表达空间关联性,每一个capsule(胶囊)独立地服务各自的任务。分析了CapsNet的基本结构和主要算法,改进了网络模型从而避免过拟合现象发生,试图基于改进CapsNet针对预处理之后的皮肤图像进行识别,并与传统卷积神经网络的模型作对比。实验结果表明,使用改进CapsNet对色素性皮肤病进行识别可以有较好的识别效果,并且准确率比传统方法高出8%~10%。
摘要:在语音增强领域,深度神经网络通过对大量含有不同噪声的语音以监督学习方式进行训练建模,从而提升网络的语音增强能力。然而不同类型噪声的获取成本较大,噪声类型难以全面采集,影响了模型的泛化能力。针对这个问题,提出一种基于生成对抗网络(Generative Adversarial Networks,GAN)的噪声数据样本增强方法,该方法对真实噪声数据进行学习,根据数据特征合成虚拟噪声,以此扩充训练集中噪声数据的数量和类型。通过实验验证,所采用的噪声合成方法能够有效扩展训练集中噪声来源,增强模型的泛化能力,有效提高语音信号去噪处理后的信噪比和可理解性。
摘要:随着科学技术的不断进步,不法分子窃电手段日趋专业化多样化,而传统的防窃电技术实时性及可行性较低。研究对运行中智能电能表用电信息的数据采集及特征提取,分析异常用电数据,应用机器学习的方法对特征值进行学习,并推导出用电异常的判断阈值,采用关联规则数据挖掘方法对独立检测的结果进行融合,从而实现窃电数据的挖掘。最后验证了模型建立的准确性,并推导出用电异常案例的甄别方法。
摘要:在数字化矿山中,行人检测系统能够大幅减少事故伤亡,是保护工人安全的重要手段。为了构建高性能的行人检测系统,提出了一种基于边窗滤波和扩张卷积的矿井行人检测模型。具体来说,针对复杂恶劣的矿井环境,采用边窗滤波抑制视频图像中的干扰信号,提升图像质量。此外,考虑到行人目标的多尺度特性,在模型中引入扩张卷积增加特征的感受野,进而提升检测性能。大量的对比实验证明了边窗滤波和扩张卷积的有效性,模型在矿井数据集上获得94.3 mAP和99.1%检测率的优异性能。
摘要:传统的卷积神经网络量化算法广泛使用对称均匀量化操作对模型权值进行量化,没有考虑到相邻权值量化之间的相互关系,即上一个权值的量化操作产生的量化噪声可以通过调整之后权值的量化方向加以弥补。针对上述问题,提出了一种基于权值交互思想的三值卷积神经网络量化算法,达到了16倍的模型压缩比,以ImageNet作为数据集,量化后的AlexNet和ResNet-18网络上模型预测准确率只下降了不到3%。该方法达到了较高的模型压缩比,具有较高的精度,可以用于将卷积神经网络移植到计算资源有限的移动端平台上。
摘要:对比于单张图像超分辨,视频图像超分辨率技术需要对输入的连续时间序列图像进行融合、对齐等处理。基于帧循环的视频超分辨率网络共分为三部分:(1)帧序列对齐网络提取图像特征,并将邻居帧对齐到中心帧;(2)帧融合网络将对齐完成的帧进行融合,使用邻居帧的信息补充中心帧信息;(3)超分辨网络将融合完成的图像放大,得到最终的高清图像。实验表明,与现有算法相比,基于帧循环网络的视频超分辨率技术产生图像更为锐利,质量更高。
摘要:在煤矿生产中,工人由于未佩戴安全帽而受伤的事故时有发生。为了构建数字化安全帽监测系统,提出了一种基于卷积神经网络的安全帽佩戴检测模型。采用先进的Darknet53网络作为模型主干,用于提取图片的特征信息。此外,在模型中引入注意力机制用于丰富特征之间的信息传播,增强模型的泛化能力。最后,制作了安全帽佩戴预训练数据集和实际矿井场景数据集,并在PyTorch平台进行全面的对比实验验证了模型设计的有效性,模型在实际矿井场景数据集上获得92.5 mAP的优异性能。
摘要:针对车标检测存在检测时间长、检测率低、可识别类型少的问题,提出一种采用You Only Look Once(YOLOv3)网络的方法。为了使该网络适用于小目标的车标检测,将目标特征提取结构Darknet-53换成Darknet-19,并且将多尺度预测层数减少为两层以减少网络参数数量。同时,为了增大车标在图像中所占比例,让卷积神经网络能学习更多的车标特征,采用将车辆从图像中裁剪后进行人工标注的方法,构建了一个包含46类车标的数据集(VLDS-46)。实验结果表明,采用该模型进行车标检测时能在实现高检测率的同时达到实时性要求,检测平均耗时为9 ms。
摘要:提出一种基于音视频匹配层自适应加权融合的身份识别方法。在不同程度的噪声情况下,图像与声音的识别率会随噪声的增强而降低,凭借单个生物模态的识别,难以达到很好的预测结果;而且两种模态融合时的权值不同,融合系统的稳定性效果也不同。采用双模态的自适应加权融合不仅可以有效地弥补不同生物模态识别之间的优缺点,而且可以自适应选择最优的权值进行决策。实验表明,该方法的理论推测成立,比单模态的身份识别具有更高的识别率与鲁棒性。
摘要:传统的道路裂缝识别方法有基于R-CNN、SPPnet、HOG+SVM等多种方法,但识别精度低、检测速度慢。针对这些缺点,提出一种基于Faster R-CNN的道路裂缝识别方法。首先,采集道路裂缝图像,建立Pascal VOC数据集;其次,基于谷歌开发的TensorFlow深度学习框架,用数据集对Faster R-CNN进行训练并分析各项性能参数指标。实验结果表明,在迭代20 000次的情况下,可将训练损失降到0.188 5,AP值达到0.780 2,取得了良好效果。
摘要:非法入侵者通过伪装人脸欺骗识别系统, 给人脸识别应用带来严重威胁。现有人脸活体检测方法多为在同一数据集内进行训练和测试,当应用在跨数据集场景中时效果并不理想。针对这一问题,提出了利用HOG等算法对上下文环境中的线索信息进行提取,提取出来的特征送入单类支持向量机进行训练、分类。将分类结果与上下文环境中异常线索的探测结果相结合。算法在公开的数据集NUAA和CASIA-FASD上进行了验证,实验结果表明在跨数据集检测时该算法的泛化能力及检测准确率较已存在算法有所提高。
摘要:为了提高文本相似度检测算法的准确度,提出一种结合潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)与Doc2Vec模型的文本相似度检测方法,并把该算法得到的模型命名为HybridDL模型。该算法通过Doc2Vec对文档训练得到文档向量,再利用LDA模型得到文档主题与各个主题下特征词出现的概率,对文档中各主题及特征词计算概率加权和,映射到Doc2Vec文档向量中。实验结果表明,新算法模型比传统的Doc2Vec模型对相似文本的判断更加敏感,在文本相似度检测上具有更高的准确度。
摘要:现有的文本相似度度量方法主要采用TF-IDF方法,把文本建模为词频向量,但未考虑文本的结构特征。现将文本的结构特征和TF-IDF方法进行融合,提出了一种面向科技项目文本的相似度度量方法。该方法首先对文本进行预处理,其次根据文本的结构特征提取模块文本,然后使用TF-IDF方法提取每个模块文本的TOP-N关键词, 作为模块文本的特征向量表示,最后使用余弦聚类计算文本的相似度。实验结果表明,在电力行业的科技项目文档数据集上,所提方法优于TF-IDF方法。
摘要:伪装人脸识别在刑侦安防领域有着巨大的应用价值。针对现阶段对伪装人脸识别的研究较少、算法鲁棒性不强等缺点,提出了基于深度神经网络的伪装人脸识别算法。改进了SqueezeNet网络模型,并将其与FaceNet网络架构进行结合,用于人脸图像的身份识别。通过在训练数据集中引入伪装人脸图像,让网络学习到伪装的特征。实验结果表明,该算法识别准确率接近90%,相较于其他网络模型,具有更好的识别效果。
摘要:传统的道岔故障检测方式不仅会耗费大量人力、物力、财力,而且检测结果完全依赖于个人工作经验。 随着人工智能的飞速发展,研究铁路道岔的智能诊断器是亟待解决的问题。提出一种智能检测系统,该系统从预处理数据、特征提取、构建不均衡数据的智能识别器以及设计更符合要求的评价标准方面进行了具体而深入的研究。 最后,通过MATLAB软件对广州钟村站W1902#和W1904#型号的道岔动作电流数据进行仿真实验。实验结果显示,智能检测系统不仅具有非常高的识别性能和泛化能力,而且识别时间仅为0.04 s, 满足铁路实时性要求。
摘要:针对传统话题检测方法在微博短文本上存在高维稀疏的缺陷,提出了一种基于特征融合的K-means微博话题发现模型。为了更好地表达微博话题的语义信息,使用在句子中共现的词对向量模型(Biterm_VSM)代替传统的向量空间模型(Vector Space Model,VSM),并结合主题模型(Latent Dirichlet Allocation,LDA)挖掘出微博短文本中的潜在语义,把两个模型得到的特征进行特征融合,并应用K-means聚类算法进行话题的发现。实验结果表明,与传统的话题检测方法相比,该模型的调整兰德系数(Adjusted Rand index,ARI)为0.80,比传统的话题检测方法提高了3%~6%。
摘要:研究了利用人工神经网络对不同频带、栅宽的砷化镓高电子迁移率晶体管进行散射参数和噪声参数提取,基于两个神经网络分别对两组散射参数和噪声参数进行训练学习,比较不同隐含层和神经元数目得出平均相对误差和均方误差,找到对应散射参数和噪声参数神经网络的最佳的隐含层数和神经元数目是8-8-6和6-4。测试结果表明,散射参数平均相对误差的平均值为2.79%,噪声参数平均相对误差的平均值为2.05%,与常规单个神经网络结构相比,在平均相对误差方面提高了31.3%,表明该模型具备更好的精度和可靠性,十分适用于宽禁带、强非线性特征的射频晶体管参数提取。
摘要:针对中文文本自动校对提出了一种新的基于Seq2Seq和Bi-LSTM结合的深度学习模型。与传统的基于规则和概率统计的方法不同,基于Seq2Seq基础结构改进,加入了Bi-LSTM单元和注意力机制,实现了一个中文文本自动校对模型。采用F0.5与GLEU指标评价,通过公开的数据集进行不同模型的对比实验。实验结果表明,新模型能有效地处理长距离的文本错误以及语义错误,Bi-RNN以及注意力机制的加入对中文文本校对模型的性能有显著提升。
摘要:针对传统的浅层特征所提取特征的判别性有限、深度特征需要大量带标记样本且训练过程耗时长的问题,提出一种深度及浅层特征融合算法用于人脸识别。首先提取人脸的HOG特征并进行判别性降维;同时,提取人脸图像的PCANet特征并降维;其次,将降维后的深浅特征进行融合,并进一步提取判别性特征;最后,采用SVM分类器进行分类并在AR和Yale B数据库上对算法进行验证。实验结果证明,该算法能够比单独选用深度特征和浅层特征进行分类达到更高的识别率,且对特征维数具有更强的鲁棒性。
摘要:针对卷积神经网络(CNN)在通用CPU以及GPU平台上推断速度慢、功耗大的问题,采用FPGA平台设计了并行化的卷积神经网络推断系统。通过运算资源重用、并行处理数据和流水线设计,并利用全连接层的稀疏性设计稀疏矩阵乘法器,大大提高运算速度,减少资源的使用。系统测试使用ORL人脸数据库,实验结果表明,在100 MHz工作频率下,模型推断性能分别是CPU的10.24倍,是GPU的3.08倍,是基准版本的1.56倍,而功率还不到2 W。最终在模型压缩了4倍的情况下,系统识别准确率为95%。
摘要:传统人脸检测算法往往不能自动地从原始图像中提取有用的检测特征,而卷积神经网络可以轻易地提取高维度的特征信息,广泛用于图像处理领域。针对上述缺点,采用简单高效的深度学习Caffe框架并通过AlexNet网络训练,数据集为LFW人脸数据集,得出一个模型分类器,对原始图像数据进行图像金字塔变换,并通过前向传播得到特征图,反变换得出人脸坐标,采用非极大值抑制算法得出最优位置,最后达到一个二分类的人脸检测结果。该方法可以实现不同尺度的人脸检测,具有较高的精度,可用于构建人脸检测系统。
摘要:提出将Transformer模型应用于中文文本自动校对领域。Transformer模型与传统的基于概率、统计、规则或引入BiLSTM的Seq2Seq模型不同,该深度学习模型通过对Seq2Seq模型进行整体结构改进,从而实现中文文本自动校对。通过使用公开数据集对不同模型进行对比实验,采用准确率、召回率与F1值作为评价指标,实验结果表明,Transformer模型相比较于其他模型,在中文文本自动校对的性能上有了大幅提升。
摘要:图像分类是根据图像的信息将不同类别的图像区分开来,是计算机视觉中重要的基本问题,也是图像检测、图像分割、物体跟踪、行为分析等其他高层视觉任务的基础。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像、声音和文本。该系统基于Caffe深度学习框架,首先对数据集进行训练分析构建深度学习网络,提取数据集图像特征信息,得到数据对应的分类模型,然后以bvlc-imagenet训练集模型为基础,对目标图像进行扩展应用,实现“以图搜图”Web应用。
摘要:为建设国家电网客户服务中心的智能对话系统,需要从大量文档、知识库、对话等数据中提炼知识形成知识图谱,提出一种融合事实图谱和事理图谱的新型知识图谱框架,能够基于多源异构数据共建新型知识图谱,在国网领域精准问答、客服系统知识支撑、对话管理引导、知识推理等方面均有较好性能。融合后的图谱及应用系统在国网客服中心问答平台中投入使用,大幅提升了客服人员工作效率和服务质量。
摘要:针对目前齿轮箱系统在利用神经网络故障诊断时存在正确识别率低和依靠经验选择参数的问题,提出了基于粒子群优化BP网络的齿轮箱故障诊断方法。简要介绍利用齿轮振动原理提取特征参数建立故障模型,该模型以齿轮箱特征向量为输入、故障类型为输出,详细分析了通过BP神经网络、概率神经网络和粒子群优化BP神经网络实现齿轮箱故障诊断。仿真结果表明,BP神经网络对齿轮箱故障诊断收敛速度慢,故障识别率为82%;概率神经网络的模型故障诊断识别率依据经验选取spread值决定,故障识别率最大为98%;粒子群优化后的BP神经网络故障诊断分类识别率为100%且自适应能力强。
摘要:探讨卷积神经网络(Convonlutional Neural Network,CNN)在肝包虫病CT图像诊断中的应用。选取两种类型的肝包虫病CT图像进行归一化、改进的中值滤波去噪和数据增强等预处理。以LeNet-5模型为基础提出改进的CNN模型CTLeNet,采用正则化策略减少过拟合问题,加入Dropout层减少参数个数,对二分类肝包虫图像进行分类实验,同时通过反卷积实现特征可视化,挖掘疾病潜在特征。结果表明,CTLeNet模型在分类任务中取得了较好的效果,有望通过深度学习方法对肝包虫病提供辅助诊断和决策支持。
摘要:设计并实现了NVIDIA嵌入式平台Jetson TX2上的车辆跟踪系统。从摄像头采集YUV420格式的视频数据,然后将数据送到Tegra Parker硬件HEVC编码器进行编码,输出码流经过RTP封装后通过UDP广播发送,利用Gstreamer多媒体框架开发接收及解码程序,最后,针对获取的视频动态进行车辆的跟踪与显示。运行Yolo V2检测算法,对车辆进行检测,从而为跟踪系统提供跟踪对象。利用Kalman滤波算法对车辆的位置进行预测,再经过Meanshift算法进行车辆跟踪。系统能够实现帧率为60 f/s的超高清4K视频实时编码和传输,此系统中的HEVC 硬件编码器编码速率比PC端x265编码器大3个数量级,PSNR比PC端x265编码器高6 dB,更加适用于智能交通中。
摘要:神经网络的存储能力一直是一个重大的缺陷,其存储主要体现在权重系数上,因此参数量一多,训练起来就十分困难。给神经网络设计一个外部关联存储器,能有效对神经网络的输入进行关联查询,并将查询的结果作为辅助输入传入到神经网络中去。此外,设计了自然语言语句的向量嵌入模型,并将模型和关联存储器集合起来形成一个自动关联语句语义向量的关联存储系统,其性能指标达到了设计要求。
摘要:针对视频序列中运动目标跟踪过程中可能出现的目标旋转、遮挡、形变等原因造成的跟踪失败问题,提出了一种基于目标多区域分割的跟踪方法。主要通过将目标划分为多个部分相互重叠的区域,然后选择跟踪过程中相对稳定的多个区域进行定位,进而对跟踪的目标采用不同目标区域权重更新不同的模板更新策略,这样选择主要可以增加算法的抗遮挡、抗旋转能力。实验结果表明,该方法对目标遮挡、旋转等具有一定的适应能力。
摘要:对绝缘栅双极型晶体管进行参数预测可以有效地避免因其失效带来的经济损失和安全问题。对绝缘栅双极型晶体管参数进行分析,设计了一个基于LSTM网络的绝缘栅双极型晶体管参数预测SoC硬件系统。该系统使用ARM处理器作为总控制器,控制各个子模块的调用和数据的传输,FPGA内通过对矩阵向量内积算法进行优化提高LSTM网络内部的数据运算速度,并且采用多项式近似的方法降低了激活函数所占用的资源。实验结果表明,系统的预测平均准确率为92.6%,计算速度相比于CPU快了3.74倍,同时具有低功耗的特点。
摘要:近年来卷积神经网络和循环神经网络在文本分类领域得到了越来越广泛的的应用。提出一种卷积神经网络和长短时记忆网络特征融合的模型,通过长短期记忆网络作为池化层的替代来获得长期依赖性,从而构建一个联合CNN和RNN的框架来克服单卷积神经网络忽略词语在上下文中语义和语法信息的问题。所提出的方法在减少参数数量和兼顾文本序列全局特征方面起着重要作用,实验结果表明,可以通过更小的框架来实现相同级别的分类性能,并且在准确率方面超越了同类型的其他几种方法。
摘要:使用财务数据构建一个多因子选股模型,在支持向量机分类上进行预测优化。选股上使用排序法对数据进行预处理,再使用支持向量机对股票收益进行分类预测,最后使用数据到分离超平面的距离进行排序,优化支持向量机的分类预测。实证中,从中证500成分股中选出股票组合,在2016年四季度到2018年一季度获得累计收益88.96%。择时策略的均线策略和通道突破策略均能有效降低波动率和回撤。还使用高频数据来降低均线策略的滞后性,波动率又得到进一步降低。本模型利用支持向量机性质提高预测精度,结合技术分析优化了策略的收益,为多因子选股和交易提供了新的研究视角。
摘要:在当前人工智能技术发展的热潮中,对话系统已经越来越实用化。与一般的闲聊对话系统不同,特定领域的对话系统是基于知识,带有上下文推理的实用性对话系统。保险领域是典型的特定领域,介绍了一种保险相关领域对话系统的基本构建方法,可以帮助用户快速、实用地在某特定领域和场景下构建对话系统,且具有一定的推广性和拓展性。
摘要:身份认证技术有了很大的发展,随之不断出现的是各种伪造合法用户信息的欺诈手段。针对这一问题,提出一种基于深度学习人脸活体检测算法,分析了真实人脸和欺诈人脸之间的区别,将真实人脸和照片进行数据去中心化、zca白化去噪声、随机旋转等处理;同时,利用卷积神经网络对照片的面部特征进行提取,提取出来的特征送入神经网络训练、分类。算法在公开的数据库NUAA上进行了验证,实验结果表明该方法降低了计算的复杂度,提高了识别准确率。
摘要:针对当前深度学习目标检测算法计算复杂度高和内存需求大等问题,设计并实现了一种基于FPGA的深度学习目标检测系统。设计对应YOLOv2-Tiny目标检测算法的硬件加速器,对加速器各模块的处理时延建模,给出卷积计算模块的详细设计。实验结果表明,与CPU相比,CPU+FPGA的异构系统是双核ARM-A9能效的67.5倍,Xeon的94.6倍;速度是双核ARM-A9的84.4倍,Xeon的5.5倍左右。并且,当前设计在性能上超过之前的工作。
摘要:针对车站、商场等大型场所中客流量大、背景复杂等原因导致多尺度人脸检测精度低的问题,建立了一种基于RefineDet多层特征图融合的多尺度人脸检测方法。首先利用第一级网络进行特征提取并在不同尺度的特征图上粗略预估人脸位置;然后在第二级中通过特征金字塔网络将低层特征与高层特征融合,进一步增强小尺寸人脸的语义信息;最后,通过置信度和焦点损失函数对检测框进行二次抑制,达到边框的精确回归。实验中将人脸候选区域的宽高比只设置为1:1,以此来降低运算量并提高人脸检测精度。在Wider Face数据集上的实验结果表明,该方法能有效检测不同尺度的人脸,在Easy、Medium、Hard 3个子数据集上测试结果分别为93.4%、92%、84.4%的MAP,尤其对小尺寸人脸的检测精度有明显提高。
摘要:多示例多标签学习框架是一种针对解决多义性问题而提出的新型机器学习框架,在多示例多标签学习框架中,一个对象是用一组示例集合来表示,并且和一组类别标签相关联。E-MIMLSVM+算法是多示例多标签学习框架中利用退化思想的经典分类算法,针对其无法利用无标签样本进行学习从而造成泛化能力差等问题,使用半监督支持向量机对该算法进行改进。改进后的算法可以利用少量有标签样本和大量没有标签的样本进行学习,有助于发现样本集内部隐藏的结构信息,了解样本集的真实分布情况。通过对比实验可以看出,改进后的算法有效提高了分类器的泛化性能。
摘要:时间序列预测是数据中心关键性能指标异常检测的重要环节。针对时间序列,利用小波基函数作为隐含层节点传递函数来构造小波神经网络进行预测;同时选取动量梯度下降法提高神经网络学习效率;再根据粒子群算法训练得到最优解作为神经网络参数初始值;最后使用MATLAB进行仿真,以较高准确性对关键性能指标时间序列进行了预测。
摘要:长期以来,各类交通事故严重影响了人们生命财产安全和社会经济发展。交通事故分析是对交通事故资料进行调查研究,发现事故动向和各种影响因素对事故总体的作用和相互关系,以便定量地认识事故现象的本质和内在规律。通过对交通事故中记录驾驶员违法行为的文本数据进行分析,提出了一种文本主题提取模型和技术,来挖掘交通事故中驾驶员风险驾驶因素,解决以往交通事故统计中交通违法行为难以挖掘的问题,计算出影响交通事故的最大支配因素。最后以北京地区一般程序处理的交通事故为例,结合北京市交通管理专家经验,验证该模型可应用于交通事故中违法行为的主题提取,结论与长期治理经验相吻合。
摘要:针对图像质量客观评价方法在实际应用场景下性能退化的问题,将人眼视觉特性融入图像特征处理的多个环节,提出一种融合视觉结构显著和视觉能量显著特征互补的方法。首先,根据人眼特性对图像的灰度能量、对比度能量和梯度结构三层互补特征进行空域-频域联合变换处理;其次,分别提取前述三层视觉特征的多通道信息并进行评价;最后,基于视觉特性和图像失真度将各层视觉特征评价从内层至外层逐步自适应综合。实验表明,本方法具有较高的水平和更好的稳定性,提高了实际应用场景下的评价性能。
摘要:为了验证股票的价格运动与过去应该是相似的这一假设,运用K近邻算法,将价格运动简单划分为涨跌两类进行预测,进行假设验证。使用滑窗方法比较现在的价格运动与何时的历史价格更为相似,将多个K近邻模型组合成集成模型,实现模型的泛化和策略收益的调整。使用中证500指数的历史价格数据进行预测实证,2017年~2018年9月的预测结果显示单个K近邻模型策略获得76.72%的收益,现在的价格运动与遥远的过去更为相似,集成模型能更好地控制风险。该模型利用K近邻模型的含义验证了股票价格运动具有相似性,可以作为证券交易的择时策略。
摘要:人脸识别技术是深度学习的重要研究领域。为了克服传统开环人脸认知模式以及深层神经网络结构的缺陷,模仿人类实时评测认知结果自寻优调节特征空间和分类认知准则的认知模式,借鉴闭环控制理论思想,探索了一种基于深度集成学习的人脸智能反馈认知方法。首先,基于DEEPID网络建立人脸图像由全局到局部具有确定映射关系的非结构化特征空间;其次,基于特征可分性评测和变精度粗糙集理论,从信息论角度建立非结构化动态特征表征的人脸认知决策信息系统模型,以约减非结构化特征空间;再次,采用集成随机权向量函数连接网络,构建简约非结构化特征空间的分类认知准则;最后,构建人脸认知结果熵测度指标,为人脸特征空间和分类认知准则的自寻优调节机制提供量化依据。实验结果表明,较已有方法,该方法有效地提高了人脸图像的识别率。
摘要:随着计算机技术的发展,融合计算机视觉、机器学习、深度学习等技术的火灾图像处理技术得到了广泛的研究和应用。针对传统图像处理方法预处理过程复杂且误报率高等问题,提出一种基于深度卷积神经网络模型进行火灾检测的方法,其减少了复杂的预处理环节,将整个火灾识别过程整合成一个单深度神经网络,便于训练与优化。针对识别过程中类似火灾场景对火灾检测产生干扰的问题,利用火灾的运动特性,创新性地提出利用火灾视频前后帧火灾坐标位置变化来排除灯光等类似火灾场景对检测的干扰。对比了众多深度学习开源框架后,选择Caffe框架进行训练及测试,实验结果表明,该方法实现了对火灾图像的识别和定位,适应于不同的火灾场景,具有很好的泛化能力和抗干扰能力。
摘要:针对在进近着陆的过程中,仪表着陆系统(ILS)易受到外界环境及空域的干扰,导致导航精度降低的问题,提出一种利用惯性导航系统(INS)与GBAS着陆系统(GLS)进行改进的组合导航算法,将组合导航系统输出位置信息之间的差值作为BP神经网络改进的无迹卡尔曼滤波器(UKF)的量测值,通过最优加权的方法得到系统的全局最优估计值。相比于传统的联邦滤波算法,该算法能有效降低测量噪声,减小飞机进近着陆时的误差,提高导航精度。
摘要:随着互联网应用的飞速发展和用户人数的急剧增长,股市评论与观点在很大程度上反映了股市行情,也影响着股市涨跌。因此,如何快速高效地分析到网民对股市的态度和观点,对股市预测具有很大指导意义。论文研究通过分析不同专业人士发布股评的情感极性来预测股票上涨与下跌趋势。提出了一种综合金融词组词典和结尾段加权的情感分析方法,能解决情感字典分析方法对领域依赖性问题,有效地提高了情感分析准确度。另外,论文还提出了一种加窗的股票预测模型,可用于分析预测事件窗口的最佳值。实验结果表明,基于股评情感分析来预测特定股票上涨或下跌趋势具有较好效果。
摘要:基于特征提取和模式识别的多体制通信信号自动调制识别技术是软件无线电领域中的重要研究课题,是复杂电磁环境下频谱管理、频谱检测等非协作通信领域的关键技术之一。提出一种基于深度学习的通信信号调制模式识别算法,应用自编码技术进行特征提取,获得具有较好的抗干扰能力的特征集,然后使用 BP神经网络对经过筛选的特征进行分类识别,实现了MQAM通信信号调制模式自动识别。仿真实验结果表明,所提出的方法分类识别效果好,有效提高了数字调制信号自动识别的抗干扰能力。
摘要:针对国网客服电话语音识别在特定领域核心词识别效果差的问题,提出一种基于HCLG领域词权重增强和领域词纠正的方法,能够实时并快速地添加领域词,从而动态地优化语言模型,提升语音识别效果。将该模型和算法优化应用在国网客服中心电话语音的咨询、维修、投诉等各种领域场景中,其语音识别结果都得到大幅改善。
摘要:4G网络技术的成熟使得用户对运营商的业务需求越来越高,如何维系用户和通过对用户属性的研究来迎合用户对业务的需求,建立方便快捷的体验服务手段,建设维系挽留系统是我国通信运营商未来发展的重中之重。首先分析移动用户维系发展现状,提出用户维系发展属性。其次,采用数据挖掘方法建立以用户稳定度和用户价值评价为基础的数据挖掘分析模型,并通过用户数据进行验证。最后,针对存量维系如何进行多渠道精准推送提出进一步展望。
摘要:由于图像中的雨线条纹具有不同形状、尺寸且分布不均匀,单一神经网络学习分布不均匀的雨密度能力弱,去雨效果不显著,对此提出雨密度感知引导扩张网络对单张图片去除雨的方法。网络分为两部分:(1)雨密度感知网络对不同密度雨的图片进行分类(大雨、中雨、小雨);(2)联合雨密度感知分类信息引导扩张网络学习不同的雨密度特征细节,用于检测雨线和去雨。实验证明了该方法在合成和真实数据集上去雨的有效性。
摘要:深度神经网络由于结构类似于生物神经网络,因此拥有高效、精准抽取信息深层隐含特征的能力和能够学习多层的抽象特征表示,且能够对跨域、多源、异质的内容信息进行学习等优势。提出了一种基于多用户-项目结合深度神经网络抽取特征、自学习等优势实现信息个性化推荐的模型,该模型通过对输入多源异构数据特征进行深度神经网络学习、抽取,再融合协同过滤中的广泛个性化产生候选集,然后通过二次模型学习产生排序集,实现精准、实时、个性化推荐。通过真实数据集对模型评估实验,实验结果表明,该模型能够很好地学习、抽取用户隐特征,并且能够一定程度上解决传统推荐系统稀疏性、新物品等问题,同时实现了更加精准、实时、个性化的推荐。
摘要:以移动机器人视觉导航为应用背景,针对传统ORB算法在视觉SLAM中存在特征点分布不均匀、重叠特征点较多的问题,提出一种改进ORB算法。首先,对每层图像的尺度空间金字塔进行网格划分,增加空间尺度信息;其次,在特征点检测时,采用改进FAST角点自适应阈值提取,设置感兴趣区域;然后,采用非极大值抑制的方法,抑制低阈值特征点的输出;最后,使用基于区域图像特征点分布的方差数值评价待检测图像中特征点的分布情况。实验结果表明,改进ORB算法特征点的分布较为均匀,输出特征点重叠数量较少,执行时间较短。
摘要:针对单独机器人难以执行复杂环境中任务的问题,Unmanned Air/Ground Vehicle(UAV/UGV)协同系统近年来受到了广泛关注。为了提高执行任务的工作效率,提出一种基于视觉传感器下UAV/UGV协同系统中UAV目标识别下UGV全局路径规划的方法,无人机利用高空视野优势获取目标物与环境信息, SURF算法和图像分割实现环境建模。无人车根据无人机获取的信息,利用优化的A*算法完成全局路径规划,并且在典型搜救场景中进行了仿真验证。实验表明,SURF算法能满足目标识别的精确度、实时性和鲁棒性;并且利用优化的A*算法实现了UGV快速准确的全局路径规划。
摘要:图像着色的目标是为灰度图像的每一个像素分配颜色,它是图像处理领域的热点问题。以U-Net为主线网络,结合深度学习和卷积神经网络设计了一个全自动的着色网络模型。在该模型中,支线使用卷积神经网络SE-Inception-ResNet-v2作为高水平的特征提取器,提取图像的全局信息,同时在网络中使用PoLU(Power Linear Unit)函数替代线性整流函数(ReLU)。实验结果证明此着色网络模型能够对灰度图像进行有效的着色。
摘要:针对卷积神经网络(CNN)中空间上的指静脉信息丢失的问题,提出了一种基于胶囊网络(Capsule Network,CapsNets)的指静脉识别算法。CapsNets在整个学习过程中以“胶囊”的形式从底层传递至高层,如此以向量的形式封装指静脉的多维特征,特征会在网络中被保存,而不是丢失后进行恢复。采用60 000张图像作为训练集,10 000张图为测试集,通过对图像增强、裁剪后进行网络学习。通过实验表明,CapsNets的网络结构特征相比CNN在处理脊线区域时效果更加明显,对比VGG精确度增加了13.6%,loss值也收敛到0.01。
摘要:设计了一种基于深度学习的实时识别硬件系统框架。该系统框架使用Keras完成卷积神经网络模型的训练并提取出网络的参数,利用ZYNQ器件的FPGA+ARM软硬件协同的方式,使用ARM完成对实时图像数据的采集、预处理及显示,通过FPGA实现卷积神经网络的硬化并对图像进行识别,再将识别结果发送至上位机进行实时显示。系统框架采用MNIST和Fashion MNIST数据集作为网络模型硬化试验样本,实验结果表明,在一般场景下该系统框架能够实时、准确地完成图像数据的获取、显示及识别,并且具有可移植性高、处理速度快、功耗低的特点。
摘要:手写体数字的识别是人工智能识别系统中的重要组成部分。因个体手写数字的差异,现有识别系统准确率较低。基于TensorFlow深度学习框架完成手写体数字的识别及应用,首先建立TensorFlow深度学习框架,并分析了Softmax、卷积神经网络(CNN)模型结构,再对手写体数据集MNIST的60 000个样本进行深度学习,然后进行10 000个样本的测试对比,最后移植最优模型到Android平台进行应用。实测数据验证,相对于传统的Softmax模型,基于TensorFlow深度学习CNN模型识别率高达99.17%,提升了7.6%,为人工智能识别系统的发展提供了一定的科研价值。
摘要:为改善人体行为识别任务中准确率低的问题,提出了一种基于批归一化的卷积神经网络(CNN)与长短期记忆(LSTM)神经网络结合的神经网络。CNN部分引入批归一化思想,将输入网络的训练样本进行小批量归一化处理,经过全连接之后,送入长短期记忆神经网络中。该算法采用时空双流网络模型结构,视频数据的RGB图像作为空间流网络输入,光流场图像作为时间流网络输入,再将时空双流网络各自得到的识别结果进行加权融合得到最终的行为识别结果。实验结果表明,本文设计的时空双流神经网络算法在人体行为识别任务上具有较高的识别准确率。
摘要: 分析美国主流新闻媒体针对“一带一路”倡议的关注热点,研究相关舆情的情感倾向。用网络爬虫自动采集相关新闻,筛选高频词获得媒体关注热点。提出一种自动摘要-卷积神经网络(Convolutional Neural Network,CNN)的集成式模型进行文档级情感分析。该模型首先提取摘要去除原始文档中非重要数据的干扰,再利用卷积神经网络进行句子级情感分析,通过基于语义指向的方法获得文档级的情感分数,并对情感波动异常文章二次分析。在真实数据上的对比实验表明,自动摘要-CNN的集成式文档级情感分析模型在情感分析方面优于单一CNN的方法。
摘要: 为改善人体行为识别任务中准确率低的问题,提出了一种基于批归一化的卷积神经网络(CNN)与长短期记忆(LSTM)神经网络结合的神经网络。CNN部分引入批归一化思想,将输入网络的训练样本进行小批量归一化处理,经过全连接之后,送入长短期记忆神经网络中。该算法采用时空双流网络模型结构,视频数据的RGB图像作为空间流网络输入,光流场图像作为时间流网络输入,再将时空双流网络各自得到的识别结果进行加权融合得到最终的行为识别结果。实验结果表明,本文设计的时空双流神经网络算法在人体行为识别任务上具有较高的识别准确率。
摘要: 手写体数字的识别是人工智能识别系统中的重要组成部分。因个体手写数字的差异,现有识别系统准确率较低。基于TensorFlow深度学习框架完成手写体数字的识别及应用,首先建立TensorFlow深度学习框架,并分析了Softmax、卷积神经网络(CNN)模型结构,再对手写体数据集MNIST的60 000个样本进行深度学习,然后进行10 000个样本的测试对比,最后移植最优模型到Android平台进行应用。实测数据验证,相对于传统的Softmax模型,基于TensorFlow深度学习CNN模型识别率高达99.17%,提升了7.6%,为人工智能识别系统的发展提供了一定的科研价值。
摘要: 设计了一种基于深度学习的实时识别硬件系统框架。该系统框架使用Keras完成卷积神经网络模型的训练并提取出网络的参数,利用ZYNQ器件的FPGA+ARM软硬件协同的方式,使用ARM完成对实时图像数据的采集、预处理及显示,通过FPGA实现卷积神经网络的硬化并对图像进行识别,再将识别结果发送至上位机进行实时显示。系统框架采用MNIST和Fashion MNIST数据集作为网络模型硬化试验样本,实验结果表明,在一般场景下该系统框架能够实时、准确地完成图像数据的获取、显示及识别,并且具有可移植性高、处理速度快、功耗低的特点。
摘要: 针对卷积神经网络(CNN)中空间上的指静脉信息丢失的问题,提出了一种基于胶囊网络(Capsule Network,CapsNets)的指静脉识别算法。CapsNets在整个学习过程中以“胶囊”的形式从底层传递至高层,如此以向量的形式封装指静脉的多维特征,特征会在网络中被保存,而不是丢失后进行恢复。采用60 000张图像作为训练集,10 000张图为测试集,通过对图像增强、裁剪后进行网络学习。通过实验表明,CapsNets的网络结构特征相比CNN在处理脊线区域时效果更加明显,对比VGG精确度增加了13.6%,loss值也收敛到0.01。
摘要: 图像着色的目标是为灰度图像的每一个像素分配颜色,它是图像处理领域的热点问题。以U-Net为主线网络,结合深度学习和卷积神经网络设计了一个全自动的着色网络模型。在该模型中,支线使用卷积神经网络SE-Inception-ResNet-v2作为高水平的特征提取器,提取图像的全局信息,同时在网络中使用PoLU(Power Linear Unit)函数替代线性整流函数(ReLU)。实验结果证明此着色网络模型能够对灰度图像进行有效的着色。
摘要: 针对目前深度学习中的卷积神经网络(CNN)在CPU平台下训练速度慢、耗时长的问题,采用现场可编程门阵列(FPGA)硬件平台设计并实现了一种深度卷积神经网络系统。该系统采用修正线性单元(ReLU)作为特征输出的激活函数并使用Softmax函数作为输出分类器。利用流水线技术并针对每一层的特征运算进行了并行处理,从而能够在1个系统时钟周期内完成整个CNN中的295次卷积运算。系统最后采用MNIST数据集作为实验样本,实验结果表明,在50 MHz的工作频率下,FPGA的训练用时相较于通用CPU的训练用时提升了8.7倍,经过2 000次迭代后系统识别的准确率为92.42%。
摘要: 穴位的位置是否找准会直接影响治疗效果,因此设计了一种基于粒子群算法优化神经网络(PSO-BP)的穴位相对坐标预测模型,然后与ARM结合构成一个可以用于人体穴位定位的系统。首先采用PC进行MATLAB仿真训练学习,然后将最优权值及阈值保存下来并简化算法嵌入ARM内,将在线预测转变为离线过程。实验结果表明:经粒子群优化过的BP神经网络有效地改善了局部极值缺陷,可应用于定位端预测穴位的位置,并在LCD中显示穴位相关信息,控制端收到位置数据后可执行电机上的运动操作。
摘要: 基于Google第二代人工智能学习系统TensorFlow构建神经网络对烟雾图像进行识别检测,通过改进的运动检测算法截取疑似烟雾区域图像,并结合PCA降维算法和Inception Resnet v2网络模型在TensorFlow平台下进行烟雾特征的训练识别。该算法实现了较大范围的火灾实时检测报警,经过实验证明整个检测过程准确地识别了视频流中的烟雾区域,相比于传统烟雾识别方法具有更高的准确率和自适应性,为大范围的火灾烟雾报警提供了一种有效方案。
摘要: 提出一种应用嵌入式技术和深度学习技术实现对胸部X光影像分析的设计方案。采用NIVIDIA公司生产的Jetson TX2作为核心板,配备以太网模块、WiFi模块等功能模块搭建该分析系统的硬件平台。在GPU服务器上利用MobileNets卷积神经网络对标注的胸部X光影像数据集进行训练,将训练好的神经网络模型移植到Jetson TX2核心板,在嵌入式平台下完成对胸腔积液、浸润、肺气肿、气胸以及肺不张症状的检测。利用美国国立卫生研究院提供的胸部X光影像数据进行测试,通过实验证明,该方法在识别准确率上优于其他的检测方法,同时识别所需时间比其他方法短。
摘要: 提出了一种用于图像分类的卷积神经网络,将不同池化方式对图像分类的影响进行了分析对比,采用重叠池化和dropout技术,较好地解决过拟合问题。与传统神经网络相比,该方法在CIFAR-10数据集上获得了较好的结果,在测试集上准确率比训练集上准确率高9%左右。
摘要: 提出一种基于机器视觉的智能导盲眼镜系统的设计方案。采用三星公司Cortex-A8架构的 S5PV210作为中央处理器,搭载Linux系统,配备双目采集、GPS定位、语音播报、GSM短信、语音通话、无线传输六大核心功能模块搭建智能导盲眼镜系统的硬件平台,结合深度学习算法在远程云服务器上完成了对目标场景的智能识别,最后以语音的形式实时对盲人的行走作出准确引导。系统测试结果表明,该智能导盲眼镜系统在测试环境下不仅能对盲人出行正确导航,还具有一定的目标识别能力,能帮助盲人进行简易物品归类。该系统还兼有GPS定位、语音通话、GSM短信等多项辅助功能。
摘要: 无人机的广泛运用,在给人们带来便利的同时,也引发了不良影响。比如,无人机飞入禁飞区引发安全问题,由于不正当的使用侵犯公民的隐私等,因此需要构建一个无人机警察系统,对无人机实施监控,遏制乱飞现象。采用传统的识别方法,灵活性不足,精度也不够高。为此提出一种基于深度学习的无人机识别算法,通过训练一个基于卷积神经网络(CNNs)的学习网络,得出一个高效的识别模型,实现无人机和非无人机间的分类。模型的测试结果表明,该方法具有较高的识别率。
摘要: 现有生产线工业机器人抓取点固定,工件只能以固定的姿态提前摆放在固定的位置,这种装配模式很难满足复杂的工业生产要求且效率低下。设计了基于视觉引导的机器人装配系统改进原有系统。设计了机器视觉系统,实现了工件的快速识别、定位以及姿态确定功能;设计了抓放系统,实现了工件的精确抓取和安装功能;采用Visual Studio的MFC开发,实现图像处理算法,并利用Socket通信将坐标和姿态数据发送给机器人。通过实验验证本系统具有良好的稳定性和快速性,可以满足生产的要求,大幅提高生产效率。