AET主站

" 人工智能"的相关文章

《电子技术应用》编辑部 聚合所有相关的文章

摘要:针对车站、商场等大型场所中客流量大、背景复杂等原因导致多尺度人脸检测精度低的问题,建立了一种基于RefineDet多层特征图融合的多尺度人脸检测方法。首先利用第一级网络进行特征提取并在不同尺度的特征图上粗略预估人脸位置;然后在第二级中通过特征金字塔网络将低层特征与高层特征融合,进一步增强小尺寸人脸的语义信息;最后,通过置信度和焦点损失函数对检测框进行二次抑制,达到边框的精确回归。实验中将人脸候选区域的宽高比只设置为1:1,以此来降低运算量并提高人脸检测精度。在Wider Face数据集上的实验结果表明,该方法能有效检测不同尺度的人脸,在Easy、Medium、Hard 3个子数据集上测试结果分别为93.4%、92%、84.4%的MAP,尤其对小尺寸人脸的检测精度有明显提高。

摘要:多示例多标签学习框架是一种针对解决多义性问题而提出的新型机器学习框架,在多示例多标签学习框架中,一个对象是用一组示例集合来表示,并且和一组类别标签相关联。E-MIMLSVM+算法是多示例多标签学习框架中利用退化思想的经典分类算法,针对其无法利用无标签样本进行学习从而造成泛化能力差等问题,使用半监督支持向量机对该算法进行改进。改进后的算法可以利用少量有标签样本和大量没有标签的样本进行学习,有助于发现样本集内部隐藏的结构信息,了解样本集的真实分布情况。通过对比实验可以看出,改进后的算法有效提高了分类器的泛化性能。

摘要:时间序列预测是数据中心关键性能指标异常检测的重要环节。针对时间序列,利用小波基函数作为隐含层节点传递函数来构造小波神经网络进行预测;同时选取动量梯度下降法提高神经网络学习效率;再根据粒子群算法训练得到最优解作为神经网络参数初始值;最后使用MATLAB进行仿真,以较高准确性对关键性能指标时间序列进行了预测。

摘要:长期以来,各类交通事故严重影响了人们生命财产安全和社会经济发展。交通事故分析是对交通事故资料进行调查研究,发现事故动向和各种影响因素对事故总体的作用和相互关系,以便定量地认识事故现象的本质和内在规律。通过对交通事故中记录驾驶员违法行为的文本数据进行分析,提出了一种文本主题提取模型和技术,来挖掘交通事故中驾驶员风险驾驶因素,解决以往交通事故统计中交通违法行为难以挖掘的问题,计算出影响交通事故的最大支配因素。最后以北京地区一般程序处理的交通事故为例,结合北京市交通管理专家经验,验证该模型可应用于交通事故中违法行为的主题提取,结论与长期治理经验相吻合。

摘要:针对图像质量客观评价方法在实际应用场景下性能退化的问题,将人眼视觉特性融入图像特征处理的多个环节,提出一种融合视觉结构显著和视觉能量显著特征互补的方法。首先,根据人眼特性对图像的灰度能量、对比度能量和梯度结构三层互补特征进行空域-频域联合变换处理;其次,分别提取前述三层视觉特征的多通道信息并进行评价;最后,基于视觉特性和图像失真度将各层视觉特征评价从内层至外层逐步自适应综合。实验表明,本方法具有较高的水平和更好的稳定性,提高了实际应用场景下的评价性能。

摘要:为了验证股票的价格运动与过去应该是相似的这一假设,运用K近邻算法,将价格运动简单划分为涨跌两类进行预测,进行假设验证。使用滑窗方法比较现在的价格运动与何时的历史价格更为相似,将多个K近邻模型组合成集成模型,实现模型的泛化和策略收益的调整。使用中证500指数的历史价格数据进行预测实证,2017年~2018年9月的预测结果显示单个K近邻模型策略获得76.72%的收益,现在的价格运动与遥远的过去更为相似,集成模型能更好地控制风险。该模型利用K近邻模型的含义验证了股票价格运动具有相似性,可以作为证券交易的择时策略。

摘要:人脸识别技术是深度学习的重要研究领域。为了克服传统开环人脸认知模式以及深层神经网络结构的缺陷,模仿人类实时评测认知结果自寻优调节特征空间和分类认知准则的认知模式,借鉴闭环控制理论思想,探索了一种基于深度集成学习的人脸智能反馈认知方法。首先,基于DEEPID网络建立人脸图像由全局到局部具有确定映射关系的非结构化特征空间;其次,基于特征可分性评测和变精度粗糙集理论,从信息论角度建立非结构化动态特征表征的人脸认知决策信息系统模型,以约减非结构化特征空间;再次,采用集成随机权向量函数连接网络,构建简约非结构化特征空间的分类认知准则;最后,构建人脸认知结果熵测度指标,为人脸特征空间和分类认知准则的自寻优调节机制提供量化依据。实验结果表明,较已有方法,该方法有效地提高了人脸图像的识别率。

摘要:随着计算机技术的发展,融合计算机视觉、机器学习、深度学习等技术的火灾图像处理技术得到了广泛的研究和应用。针对传统图像处理方法预处理过程复杂且误报率高等问题,提出一种基于深度卷积神经网络模型进行火灾检测的方法,其减少了复杂的预处理环节,将整个火灾识别过程整合成一个单深度神经网络,便于训练与优化。针对识别过程中类似火灾场景对火灾检测产生干扰的问题,利用火灾的运动特性,创新性地提出利用火灾视频前后帧火灾坐标位置变化来排除灯光等类似火灾场景对检测的干扰。对比了众多深度学习开源框架后,选择Caffe框架进行训练及测试,实验结果表明,该方法实现了对火灾图像的识别和定位,适应于不同的火灾场景,具有很好的泛化能力和抗干扰能力。

摘要:针对在进近着陆的过程中,仪表着陆系统(ILS)易受到外界环境及空域的干扰,导致导航精度降低的问题,提出一种利用惯性导航系统(INS)与GBAS着陆系统(GLS)进行改进的组合导航算法,将组合导航系统输出位置信息之间的差值作为BP神经网络改进的无迹卡尔曼滤波器(UKF)的量测值,通过最优加权的方法得到系统的全局最优估计值。相比于传统的联邦滤波算法,该算法能有效降低测量噪声,减小飞机进近着陆时的误差,提高导航精度。

摘要:随着互联网应用的飞速发展和用户人数的急剧增长,股市评论与观点在很大程度上反映了股市行情,也影响着股市涨跌。因此,如何快速高效地分析到网民对股市的态度和观点,对股市预测具有很大指导意义。论文研究通过分析不同专业人士发布股评的情感极性来预测股票上涨与下跌趋势。提出了一种综合金融词组词典和结尾段加权的情感分析方法,能解决情感字典分析方法对领域依赖性问题,有效地提高了情感分析准确度。另外,论文还提出了一种加窗的股票预测模型,可用于分析预测事件窗口的最佳值。实验结果表明,基于股评情感分析来预测特定股票上涨或下跌趋势具有较好效果。

摘要:基于特征提取和模式识别的多体制通信信号自动调制识别技术是软件无线电领域中的重要研究课题,是复杂电磁环境下频谱管理、频谱检测等非协作通信领域的关键技术之一。提出一种基于深度学习的通信信号调制模式识别算法,应用自编码技术进行特征提取,获得具有较好的抗干扰能力的特征集,然后使用 BP神经网络对经过筛选的特征进行分类识别,实现了MQAM通信信号调制模式自动识别。仿真实验结果表明,所提出的方法分类识别效果好,有效提高了数字调制信号自动识别的抗干扰能力。

摘要:针对国网客服电话语音识别在特定领域核心词识别效果差的问题,提出一种基于HCLG领域词权重增强和领域词纠正的方法,能够实时并快速地添加领域词,从而动态地优化语言模型,提升语音识别效果。将该模型和算法优化应用在国网客服中心电话语音的咨询、维修、投诉等各种领域场景中,其语音识别结果都得到大幅改善。

摘要:4G网络技术的成熟使得用户对运营商的业务需求越来越高,如何维系用户和通过对用户属性的研究来迎合用户对业务的需求,建立方便快捷的体验服务手段,建设维系挽留系统是我国通信运营商未来发展的重中之重。首先分析移动用户维系发展现状,提出用户维系发展属性。其次,采用数据挖掘方法建立以用户稳定度和用户价值评价为基础的数据挖掘分析模型,并通过用户数据进行验证。最后,针对存量维系如何进行多渠道精准推送提出进一步展望。

摘要:由于图像中的雨线条纹具有不同形状、尺寸且分布不均匀,单一神经网络学习分布不均匀的雨密度能力弱,去雨效果不显著,对此提出雨密度感知引导扩张网络对单张图片去除雨的方法。网络分为两部分:(1)雨密度感知网络对不同密度雨的图片进行分类(大雨、中雨、小雨);(2)联合雨密度感知分类信息引导扩张网络学习不同的雨密度特征细节,用于检测雨线和去雨。实验证明了该方法在合成和真实数据集上去雨的有效性。

摘要:深度神经网络由于结构类似于生物神经网络,因此拥有高效、精准抽取信息深层隐含特征的能力和能够学习多层的抽象特征表示,且能够对跨域、多源、异质的内容信息进行学习等优势。提出了一种基于多用户-项目结合深度神经网络抽取特征、自学习等优势实现信息个性化推荐的模型,该模型通过对输入多源异构数据特征进行深度神经网络学习、抽取,再融合协同过滤中的广泛个性化产生候选集,然后通过二次模型学习产生排序集,实现精准、实时、个性化推荐。通过真实数据集对模型评估实验,实验结果表明,该模型能够很好地学习、抽取用户隐特征,并且能够一定程度上解决传统推荐系统稀疏性、新物品等问题,同时实现了更加精准、实时、个性化的推荐。

摘要:以移动机器人视觉导航为应用背景,针对传统ORB算法在视觉SLAM中存在特征点分布不均匀、重叠特征点较多的问题,提出一种改进ORB算法。首先,对每层图像的尺度空间金字塔进行网格划分,增加空间尺度信息;其次,在特征点检测时,采用改进FAST角点自适应阈值提取,设置感兴趣区域;然后,采用非极大值抑制的方法,抑制低阈值特征点的输出;最后,使用基于区域图像特征点分布的方差数值评价待检测图像中特征点的分布情况。实验结果表明,改进ORB算法特征点的分布较为均匀,输出特征点重叠数量较少,执行时间较短。

摘要:针对单独机器人难以执行复杂环境中任务的问题,Unmanned Air/Ground Vehicle(UAV/UGV)协同系统近年来受到了广泛关注。为了提高执行任务的工作效率,提出一种基于视觉传感器下UAV/UGV协同系统中UAV目标识别下UGV全局路径规划的方法,无人机利用高空视野优势获取目标物与环境信息, SURF算法和图像分割实现环境建模。无人车根据无人机获取的信息,利用优化的A*算法完成全局路径规划,并且在典型搜救场景中进行了仿真验证。实验表明,SURF算法能满足目标识别的精确度、实时性和鲁棒性;并且利用优化的A*算法实现了UGV快速准确的全局路径规划。

摘要:图像着色的目标是为灰度图像的每一个像素分配颜色,它是图像处理领域的热点问题。以U-Net为主线网络,结合深度学习和卷积神经网络设计了一个全自动的着色网络模型。在该模型中,支线使用卷积神经网络SE-Inception-ResNet-v2作为高水平的特征提取器,提取图像的全局信息,同时在网络中使用PoLU(Power Linear Unit)函数替代线性整流函数(ReLU)。实验结果证明此着色网络模型能够对灰度图像进行有效的着色。

摘要:针对卷积神经网络(CNN)中空间上的指静脉信息丢失的问题,提出了一种基于胶囊网络(Capsule Network,CapsNets)的指静脉识别算法。CapsNets在整个学习过程中以“胶囊”的形式从底层传递至高层,如此以向量的形式封装指静脉的多维特征,特征会在网络中被保存,而不是丢失后进行恢复。采用60 000张图像作为训练集,10 000张图为测试集,通过对图像增强、裁剪后进行网络学习。通过实验表明,CapsNets的网络结构特征相比CNN在处理脊线区域时效果更加明显,对比VGG精确度增加了13.6%,loss值也收敛到0.01。

摘要:设计了一种基于深度学习的实时识别硬件系统框架。该系统框架使用Keras完成卷积神经网络模型的训练并提取出网络的参数,利用ZYNQ器件的FPGA+ARM软硬件协同的方式,使用ARM完成对实时图像数据的采集、预处理及显示,通过FPGA实现卷积神经网络的硬化并对图像进行识别,再将识别结果发送至上位机进行实时显示。系统框架采用MNIST和Fashion MNIST数据集作为网络模型硬化试验样本,实验结果表明,在一般场景下该系统框架能够实时、准确地完成图像数据的获取、显示及识别,并且具有可移植性高、处理速度快、功耗低的特点。

摘要:手写体数字的识别是人工智能识别系统中的重要组成部分。因个体手写数字的差异,现有识别系统准确率较低。基于TensorFlow深度学习框架完成手写体数字的识别及应用,首先建立TensorFlow深度学习框架,并分析了Softmax、卷积神经网络(CNN)模型结构,再对手写体数据集MNIST的60 000个样本进行深度学习,然后进行10 000个样本的测试对比,最后移植最优模型到Android平台进行应用。实测数据验证,相对于传统的Softmax模型,基于TensorFlow深度学习CNN模型识别率高达99.17%,提升了7.6%,为人工智能识别系统的发展提供了一定的科研价值。

摘要:为改善人体行为识别任务中准确率低的问题,提出了一种基于批归一化的卷积神经网络(CNN)与长短期记忆(LSTM)神经网络结合的神经网络。CNN部分引入批归一化思想,将输入网络的训练样本进行小批量归一化处理,经过全连接之后,送入长短期记忆神经网络中。该算法采用时空双流网络模型结构,视频数据的RGB图像作为空间流网络输入,光流场图像作为时间流网络输入,再将时空双流网络各自得到的识别结果进行加权融合得到最终的行为识别结果。实验结果表明,本文设计的时空双流神经网络算法在人体行为识别任务上具有较高的识别准确率。

摘要: 分析美国主流新闻媒体针对“一带一路”倡议的关注热点,研究相关舆情的情感倾向。用网络爬虫自动采集相关新闻,筛选高频词获得媒体关注热点。提出一种自动摘要-卷积神经网络(Convolutional Neural Network,CNN)的集成式模型进行文档级情感分析。该模型首先提取摘要去除原始文档中非重要数据的干扰,再利用卷积神经网络进行句子级情感分析,通过基于语义指向的方法获得文档级的情感分数,并对情感波动异常文章二次分析。在真实数据上的对比实验表明,自动摘要-CNN的集成式文档级情感分析模型在情感分析方面优于单一CNN的方法。

摘要: 为改善人体行为识别任务中准确率低的问题,提出了一种基于批归一化的卷积神经网络(CNN)与长短期记忆(LSTM)神经网络结合的神经网络。CNN部分引入批归一化思想,将输入网络的训练样本进行小批量归一化处理,经过全连接之后,送入长短期记忆神经网络中。该算法采用时空双流网络模型结构,视频数据的RGB图像作为空间流网络输入,光流场图像作为时间流网络输入,再将时空双流网络各自得到的识别结果进行加权融合得到最终的行为识别结果。实验结果表明,本文设计的时空双流神经网络算法在人体行为识别任务上具有较高的识别准确率。

摘要: 手写体数字的识别是人工智能识别系统中的重要组成部分。因个体手写数字的差异,现有识别系统准确率较低。基于TensorFlow深度学习框架完成手写体数字的识别及应用,首先建立TensorFlow深度学习框架,并分析了Softmax、卷积神经网络(CNN)模型结构,再对手写体数据集MNIST的60 000个样本进行深度学习,然后进行10 000个样本的测试对比,最后移植最优模型到Android平台进行应用。实测数据验证,相对于传统的Softmax模型,基于TensorFlow深度学习CNN模型识别率高达99.17%,提升了7.6%,为人工智能识别系统的发展提供了一定的科研价值。

摘要: 设计了一种基于深度学习的实时识别硬件系统框架。该系统框架使用Keras完成卷积神经网络模型的训练并提取出网络的参数,利用ZYNQ器件的FPGA+ARM软硬件协同的方式,使用ARM完成对实时图像数据的采集、预处理及显示,通过FPGA实现卷积神经网络的硬化并对图像进行识别,再将识别结果发送至上位机进行实时显示。系统框架采用MNIST和Fashion MNIST数据集作为网络模型硬化试验样本,实验结果表明,在一般场景下该系统框架能够实时、准确地完成图像数据的获取、显示及识别,并且具有可移植性高、处理速度快、功耗低的特点。

摘要: 针对卷积神经网络(CNN)中空间上的指静脉信息丢失的问题,提出了一种基于胶囊网络(Capsule Network,CapsNets)的指静脉识别算法。CapsNets在整个学习过程中以“胶囊”的形式从底层传递至高层,如此以向量的形式封装指静脉的多维特征,特征会在网络中被保存,而不是丢失后进行恢复。采用60 000张图像作为训练集,10 000张图为测试集,通过对图像增强、裁剪后进行网络学习。通过实验表明,CapsNets的网络结构特征相比CNN在处理脊线区域时效果更加明显,对比VGG精确度增加了13.6%,loss值也收敛到0.01。

摘要: 图像着色的目标是为灰度图像的每一个像素分配颜色,它是图像处理领域的热点问题。以U-Net为主线网络,结合深度学习和卷积神经网络设计了一个全自动的着色网络模型。在该模型中,支线使用卷积神经网络SE-Inception-ResNet-v2作为高水平的特征提取器,提取图像的全局信息,同时在网络中使用PoLU(Power Linear Unit)函数替代线性整流函数(ReLU)。实验结果证明此着色网络模型能够对灰度图像进行有效的着色。

摘要: 针对目前深度学习中的卷积神经网络(CNN)在CPU平台下训练速度慢、耗时长的问题,采用现场可编程门阵列(FPGA)硬件平台设计并实现了一种深度卷积神经网络系统。该系统采用修正线性单元(ReLU)作为特征输出的激活函数并使用Softmax函数作为输出分类器。利用流水线技术并针对每一层的特征运算进行了并行处理,从而能够在1个系统时钟周期内完成整个CNN中的295次卷积运算。系统最后采用MNIST数据集作为实验样本,实验结果表明,在50 MHz的工作频率下,FPGA的训练用时相较于通用CPU的训练用时提升了8.7倍,经过2 000次迭代后系统识别的准确率为92.42%。

摘要: 穴位的位置是否找准会直接影响治疗效果,因此设计了一种基于粒子群算法优化神经网络(PSO-BP)的穴位相对坐标预测模型,然后与ARM结合构成一个可以用于人体穴位定位的系统。首先采用PC进行MATLAB仿真训练学习,然后将最优权值及阈值保存下来并简化算法嵌入ARM内,将在线预测转变为离线过程。实验结果表明:经粒子群优化过的BP神经网络有效地改善了局部极值缺陷,可应用于定位端预测穴位的位置,并在LCD中显示穴位相关信息,控制端收到位置数据后可执行电机上的运动操作。

摘要: 基于Google第二代人工智能学习系统TensorFlow构建神经网络对烟雾图像进行识别检测,通过改进的运动检测算法截取疑似烟雾区域图像,并结合PCA降维算法和Inception Resnet v2网络模型在TensorFlow平台下进行烟雾特征的训练识别。该算法实现了较大范围的火灾实时检测报警,经过实验证明整个检测过程准确地识别了视频流中的烟雾区域,相比于传统烟雾识别方法具有更高的准确率和自适应性,为大范围的火灾烟雾报警提供了一种有效方案。

摘要: 提出一种应用嵌入式技术和深度学习技术实现对胸部X光影像分析的设计方案。采用NIVIDIA公司生产的Jetson TX2作为核心板,配备以太网模块、WiFi模块等功能模块搭建该分析系统的硬件平台。在GPU服务器上利用MobileNets卷积神经网络对标注的胸部X光影像数据集进行训练,将训练好的神经网络模型移植到Jetson TX2核心板,在嵌入式平台下完成对胸腔积液、浸润、肺气肿、气胸以及肺不张症状的检测。利用美国国立卫生研究院提供的胸部X光影像数据进行测试,通过实验证明,该方法在识别准确率上优于其他的检测方法,同时识别所需时间比其他方法短。

摘要: 提出了一种用于图像分类的卷积神经网络,将不同池化方式对图像分类的影响进行了分析对比,采用重叠池化和dropout技术,较好地解决过拟合问题。与传统神经网络相比,该方法在CIFAR-10数据集上获得了较好的结果,在测试集上准确率比训练集上准确率高9%左右。

摘要: 提出一种基于机器视觉的智能导盲眼镜系统的设计方案。采用三星公司Cortex-A8架构的 S5PV210作为中央处理器,搭载Linux系统,配备双目采集、GPS定位、语音播报、GSM短信、语音通话、无线传输六大核心功能模块搭建智能导盲眼镜系统的硬件平台,结合深度学习算法在远程云服务器上完成了对目标场景的智能识别,最后以语音的形式实时对盲人的行走作出准确引导。系统测试结果表明,该智能导盲眼镜系统在测试环境下不仅能对盲人出行正确导航,还具有一定的目标识别能力,能帮助盲人进行简易物品归类。该系统还兼有GPS定位、语音通话、GSM短信等多项辅助功能。

摘要: 无人机的广泛运用,在给人们带来便利的同时,也引发了不良影响。比如,无人机飞入禁飞区引发安全问题,由于不正当的使用侵犯公民的隐私等,因此需要构建一个无人机警察系统,对无人机实施监控,遏制乱飞现象。采用传统的识别方法,灵活性不足,精度也不够高。为此提出一种基于深度学习的无人机识别算法,通过训练一个基于卷积神经网络(CNNs)的学习网络,得出一个高效的识别模型,实现无人机和非无人机间的分类。模型的测试结果表明,该方法具有较高的识别率。

摘要: 现有生产线工业机器人抓取点固定,工件只能以固定的姿态提前摆放在固定的位置,这种装配模式很难满足复杂的工业生产要求且效率低下。设计了基于视觉引导的机器人装配系统改进原有系统。设计了机器视觉系统,实现了工件的快速识别、定位以及姿态确定功能;设计了抓放系统,实现了工件的精确抓取和安装功能;采用Visual Studio的MFC开发,实现图像处理算法,并利用Socket通信将坐标和姿态数据发送给机器人。通过实验验证本系统具有良好的稳定性和快速性,可以满足生产的要求,大幅提高生产效率。