百川智能发布 Baichuan2-192K 大模型 可处理约35万个汉字

2025-02-20 0 585

百川智能发布了 Baichuan2-192K 大模型,具有全球最长的上下文窗口长度,能够处理约35万个汉字。

与目前最优秀的大模型 Claude2相比,Baichuan2-192K 的上下文窗口长度超过了4.4倍,超过了 GPT-4的14倍。

Baichuan2-192K 在长窗口文本生成、理解、问答、摘要等方面表现出色,并在10项长文本评测中取得了7项 SOTA 成绩。

据悉,Baichuan2-192K 通过算法和工程的优化,实现了窗口长度和模型性能的平衡,采用动态采样的位置编码优化和4D 并行的分布式方案。

目前,Baichuan2-192K 已经开始内测,已与法律、媒体、金融等行业的核心合作伙伴合作,将于不久后全面开放。Baichuan2-192K 能够应用于长篇文档关键信息提取与分析、长文档摘要、审核、编写、复杂编程辅助等场景,并为多模态输入和迁移学习提供支持。

百川大模型官网:https://www.baichuan-ai.com/home

若非本站原创的文章,特别作如下声明:
本文刊载所有内容仅供提供信息交流和业务探讨而非提供法律建议目的使用,不代表任何监管机构的立场和观点。
不承担任何由于内容的合法性及真实性所引起的争议和法律责任。
凡注明为其他媒体来源的信息,均为转载,版权归版权所有人所有。
如有未注明作者及出处的文章和资料等素材,请版权所有者联系我们,我们将及时补上或者删除,共同建设自媒体信息平台,感谢你的支持!

AI老司机 AI行业动态 百川智能发布 Baichuan2-192K 大模型 可处理约35万个汉字 https://www.ailsj.cn/316.html

相关文章

发表评论
暂无评论