中国科学院自动化研究所和武汉人工智能研究院推出新一代多模态大模型,支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务,拥有更强的认知、理解、创作能力,带来全新互动体验。紫东太初,zdtc,中科院大模型,大模型
——
紫东太初2.0可以做什么
紫东太初2.0可以理解三维场景、信号等数字物联时代的重要信息,完成了音乐、图片和视频等数据之间的跨模态对齐,能够处理音乐视频分析、三维导航等多模态关联应用需求,并可实现音乐、视频等多模态内容理解和生成。
文本创作
文案创意写作、文本扩写、文章续写、内容摘要、多语种翻译、写诗作词、写代码、解数学题样样拿手
知识问答
专属知识库和联网搜索实现大模型检索增强,有效缓解幻觉,加速知识学习,使得大模型更加实用和可信
多模态理解
关注图文音三模态数据之间的关联特性,支持图文问答、视觉定位、视觉指代、OCR问答、音乐理解
多模态内容生成
多种艺术风格的AI作画,精准控制绘画细节;文本指令可智能作曲生成音乐片段
3D理解
基于点云数据的3D场景理解和物体感知能力
信号分析
支持雷达信号鉴别与知识交互,可借助模型快速掌握信号基本来源及参数等