书生大模型上手体验

AI 知识库16小时前发布
859 0 0
熊猫办公
2月4日,上海人工智能实验室发布了科学领域垂类大模型——书生(Intern-S1-Pro),该大模型号称不仅于解题目更是聚焦于解决问题,作为科学领域的研究伙伴来使用。
接下来我们来上手试一下。
网址:https://chat.intern-ai.org.cn/
书生大模型上手体验
任务一:解析一份物理作业。
1.将小朋友的一份物理作业拍照,上传至书生大模型。输入提示词:请批改附件图片中的作答,并提供解析。
书生大模型上手体验
2.大模型解读并思考,完成后提供解析。
发现多道题目解析错误。
书生大模型上手体验
于是,将题目上传至千问大模型,千问给出了不同的答案。
为了防止千问也是错的,于是又传给了豆包,发现确实是书生大模型犯了错。
书生大模型上手体验
千问的回答
书生大模型上手体验
豆包的回答
但是,当我手动将题目上传至书生时,又给出了正确的答案。
书生大模型上手体验
不清楚书生发生了啥。期待快速的解决类似幻觉,不然会误导很多人。
2.测试一些学科经典问题的解答情况
由于本人属于理科不精、文科不熟的选手,无法从大脑中筛选题目来测试,只能借助大模型来测试大模型,类似于蒸馏的模式。选用的师傅模型为千问,目前参数规模最大的一个模型,要求他出两个题目,一个是物理的,一个是编程的。
书生大模型上手体验
书生大模型上手体验
测试思路是,将大模型生成题目扔给书生,将书生的答案扔回给千问,由千问点评。
问题1的书生答案:
书生大模型上手体验
书生大模型上手体验
书生大模型上手体验
书生大模型上手体验
书生大模型上手体验
千问认为答案很好。
书生大模型上手体验
问题2的书生答案:
书生大模型上手体验
书生大模型上手体验
书生大模型上手体验
书生大模型上手体验
千问的评价也是不错的。说实话,虽然编程是我的专业领域,但是半衰期的公式我是真不知道。
书生大模型上手体验
由此可见,对于这两个经典问题的回答,书生大模型表现还是不错的。
3.书生特色功能
奥林匹克解题智能体
书生大模型上手体验
强推理模型
书生大模型上手体验
秒析,一键分析美学细胞。
书生大模型上手体验
MindSearch深度搜索引擎
书生大模型上手体验
总之,期待书生大模型能够持续迭代,不断满足科学教育的需求。
© 版权声明

相关文章