AET主站

" 技术专栏—高性能计算"的相关文章

《电子技术应用》编辑部 聚合所有相关的文章

摘要:针对目前的煤矿监控数据采集系统存在数据编码标准不统一、单系统运行可靠性差、数据可视工具不支持WEB方式和主机不能智能切换的问题,基于工业互联网平台技术体系,利用前后端分离和Restful API接口访问等技术,融合互联网开源报表等组件,研究设计一个面向微服务架构的煤矿生产监控数据采集系统,介绍了目前煤矿监控数据采集系统存在的问题,完成了面向微服务架构的煤矿监控数据采集系统架构设计,具体阐述了数据统一标准化、单通道采集微服务化处理、数据服务状态监控和数据可视化组件等关键技术。煤矿生产监控数据采集系统在山西天地王坡煤矿进行了工程验证,应用结果表明,按照统一标准的规范设计数据模型,通过把数据采集、数据服务、可视化等应用微服务部署运行,实现了煤矿生产监控数据采集及监视,为煤矿其他应用提供重要的数据支撑和基础保障,同时,微服务运行的方式提高了煤矿系统维护人员的运维效率。

摘要:图像语义分割网络为了提升精度常采用结构复杂的卷积层作为基础的特征提取单元,这类卷积层存在的不同类型卷积增加了对网络并行加速计算的难度。针对语义分割网络不同类型的卷积的加速计算需求,提出一种基于FPGA的面向多类型卷积的并行计算加速器。首先对卷积的计算原理进行分析,然后根据不同卷积类型的基本运算原理构建多乘法并行计算的处理单元,并通过多处理单元并行、数据重用以及PIPELINE方法对卷积进行加速计算。实验结果表明,对于特定尺寸的特征图,使用所提的卷积加速器设计方法最多可以达到113倍的速度提升。 关键词:图像语义分割;多类型卷积;FPGA;计算加速

摘要:提出了一种基于FPGA的通用CNN硬件加速器设计方案。针对计算量最大的卷积层,采用了输入通道并行、核内并行、输出通道并行三种加速方式,根据FPGA的片上资源,合理地设置相应并行度。在数据加载方面,采用相邻数据位宽合并传输,有效提高了加速器的实际传输带宽。基于行的数据流加载思想,设计了输入缓存模块。该缓存模块只需缓存两行数据即可开始卷积运算,有效地提前卷积运算的开始时间。在数据输入、数据运算、数据输出模块之间,利用流水线循环优化方式,极大地提高了硬件的计算性能。最后将该加速器应用于VGG16和Darknet-19网络,实验表明,计算性能分别达到34.30 GOPS和33.68 GOPS,DSP计算效率分别高达79.45%和78.01%。

摘要:摘 要:随着神经网络层数不断加深,稀疏深度神经网络在计算与存储空间上更具优势,但稀疏深度神经网络的性能仍然有待优化。为此提出基于GPU的稀疏深度神经网络性能优化方法,对于计算顺序进行调整,增强数据重用性,并结合GPU的独特结构与CUDA编程方法,通过预取等方法进一步提升性能。基于GraphChallenge官方提供的数据集,相较于cuSPARSE相关库函数,最高获得了2.5倍的性能加速。

摘要:自动驾驶仿真平台是解决自动驾驶中实车测试时间长、成本高和极端场景复现难的问题的有效手段。随着大规模云计算和高性能异构计算的引入,仿真平台面临着高效虚拟化、均衡调度、便捷端-云交互的挑战。为此,设计了支持轻量级虚拟化的并行系统架构,并设计和集成了细粒度资源均衡调度和低延时远程交互方法,构建了ADsim高性能并行仿真平台,经过测试验证,平台具备高性能和便捷交互特点。 关键词:自动驾驶;仿真;高性能;并行

摘要:分子动力学(Molecular Dynamics,MD)模拟是探索微观世界的重要工具,在多个领域中得到广泛应用。二维材料是MD在材料科学领域的一个重要研究方向,其中层间作用力的计算是耗时最多的部分。高性能计算是能够提升二维材料模拟效率的关键技术,利用新一代神威超级计算机的强大计算能力,来提高二维材料体系的MD模拟效率。针对层间力场的计算,采用消除冗余计算、多核心融合和设置缓冲区等多种算法优化策略;采用软件Cache累加受力、从核通信累加能量和从核C++特性等技术实现线程级并行;采用软硬件Cache协同策略提升访存效率。实验结果表明:优化后的整体性能提升155倍,模拟效率可达2 ns/day,弱扩展并行效率达到92.7%。