飞桨高性能推理升级:大语言模型及多模态大模型部署加速
飞桨框架3.0在大模型推理部署领域实现全面升级,聚焦于提升性能、优化效率与跨硬件兼容性。其核心在于基于高扩展性的中间表示(PIR)和灵活的PASS机制,构建了新一代推理引擎,显著增强模型部署的灵活性与 ...[阅读全文]
飞桨框架3.0在大模型推理部署领域实现全面升级,聚焦于提升性能、优化效率与跨硬件兼容性。其核心在于基于高扩展性的中间表示(PIR)和灵活的PASS机制,构建了新一代推理引擎,显著增强模型部署的灵活性与 ...[阅读全文]
MiniMax-M1 的发布标志着全球开源大模型在长上下文处理与智能体应用能力上的重大突破。该模型基于创新的 Lightning Attention 架构,实现了高达 100 万 token 的输入上 ...[阅读全文]
字节跳动创始人张一鸣并未“重回一线”,其主要办公地仍位于新加坡,持续聚焦前沿AI技术研发,定期与研究人员交流,并参与核心团队的复盘讨论。尽管有消息称他频繁往返北京,但官方及知情 ...[阅读全文]
商务号,添加请说明来意
返回顶部