Reka Flash 最新更新: 多模态AI的突破性进展

多模态理解升级

核心升级
  • 支持128K令牌的上下文长度
  • 处理交错的多模态输入(文本、图像、视频、音频)
  • 210亿参数,性能卓越
  • 支持任意图像分辨率和纵横比
  • 增强OCR能力,改进文档、表格、图表和图解理解

视频处理能力

视觉增强
  • 高级时间理解能力
  • 原生捕捉视频中的音频对话和环境声音
  • 支持长达3-5分钟的视频(可通过流式处理更长视频)
  • 支持视频片段检索等新用例

推理能力提升

性能提升
  • 改进推理和一般聊天能力
  • ELO评分提高43点
  • 整体质量评分从66.1%提升至72.2%
  • LMSYS Chatbot Arena上ELO从1148上升到1204

多语言支持

语言扩展
  • 预训练支持32种语言
  • 重点支持12种主要语言
  • 英语、印尼语、泰语、越南语、泰米尔语、印地语
  • 阿拉伯语、日语、韩语、西班牙语、法语、意大利语

指令执行增强

指令优化
  • 显著改进指令执行能力,包括多步骤指令
  • 适合作为支持代理任务的构建块
  • 在MegaTask基准测试中表现优异(51.8%)

功能调用与工具使用

功能扩展
  • 支持函数调用,实现与用户定义函数的无缝交互
  • 函数调用作为结构化输出返回
  • 在遵循一般输出格式指令方面的表现从40.4%提升到83.6%