9月24日,CCF HPC China 2024在武汉中国光谷科技会展中心盛大举行。展会以“华章廿载,新质未来”为主题,邀请了数百位来自算力领域的顶尖学者,近百家全球算力领域头部企业,深度聚焦新质生产力与AI融合、算力服务创新及大…
1. 语言模型之精简RNN结构 近期关注到,Yoshua Bengio发布了一篇论文《Were RNNs All We Needed?》,提出简化版RNN(minLSTM和minGRU)。该工作的初始缘由:Transformer 在序列长度方面的扩展性限制重新引发了对可在训练期…