(北京1日综合电)中国人工智能初创企业白川科技推出了一款据称可以消化和总结小说的人工智能(AI)模型,其文字处理量高达35万字,超越了ChatGPT等多个竞争对手,使其成为世界上处理长文本提示功能最强大的语言模型。
这家总部位于北京的公司由中国搜索引擎搜狗的创始人王小川创立。该公司周一发布了其最新版本Baichuan2-192K
ADVERTISEMENT
大型语言模型(LLM),称其“上下文窗口”可处理约35万个汉字。
上下文窗口是模型在与用户对话期间,可处理的输入和输出文本的组合。
据《南华早报》报道,相比之下,今年7月由亚马逊支持的Anthropic推出的Claude 2,就用户在聊天查询中可以包含的单词数量而言,是世界上最先进的AI模型。据称,Claude 2拥有大约7.5万个英语单词的上下文窗口,相当于数百页的文件或一本书。
根据百川智能的微信帖子,Baichuan2-192K的上下文窗口比OpenAI的GPT-4-32k强14倍。
白川智能还宣称,其模型在回复质量、对长文本的理解和总结方面都超过了Claude 2,并引用了LongEval的测试结果。LongEval是加州大学伯克利分校和其他美国机构发起的一个项目,旨在评估法学硕士处理大型提示的能力。
百川面临来自国内竞争对手的激烈竞争。阿里巴巴集团旗下的云计算部门周二宣布更新其“通义千问”模型,后者据称已通过数千亿参数的训练。
阿里云技术总监周靖人在公司年度合作伙伴活动上表示,“通义千问”2.0优于OpenAI的ChatGPT 3.5和Meta平台的Llama2,并缩小了与ChatGPT 4的差距。
与此同时,由阿里巴巴和腾讯控股支持的初创企业智璞上周推出了ChatGLM3模型,该模型进行了多项改进,包括更快的推理速度、更低的培训成本,以及增加了一个编码助手。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT