发布网友 发布时间:2024-10-21 14:39
共1个回答
热心网友 时间:2024-11-11 04:33
本文概览了20篇重点论文,涵盖PPoPP(并行编程原理与实践)会议,内容涉及高性能计算、机器学习工作负载、优化内存、线性代数及应用领域。论文探讨了深度神经网络的稀疏性、锁作为资源的公平调度、自动混合精度代码生成与调优、下标下标自动并行化的递归分析、共享内存众核上的可扩展非结构化网格计算、Pure项目发展消息传递以更好地利用节点内共享内存、基于GPU的大型输出图查询处理、互连层次感知图处理、在以集合为中心的图模式挖掘中利用细粒度冗余、GPU上加速稀疏卷积、适用于各种异构片上系统的共享内存争用感知并发DNN执行、几分钟内训练一个DeePMD模型、基于并行图的近似最近邻搜索算法、具有批量更新和异步读取的并行k-Core分解、并行整数排序、将模板计算转换为张量核心上的矩阵乘法、高效的无指针批量并行压缩集、通用GPU内存管理器、优化AlphaFold训练和推理在GPU集群上、快速高效的GPU加速用于长读映射的引导序列比对。这些论文提供了并行编程领域的前沿洞见和实际应用,为科研与开发提供宝贵参考。