Reka Flash 最新更新: 多模态AI的突破性进展
- 支持128K令牌的上下文长度
- 处理交错的多模态输入(文本、图像、视频、音频)
- 210亿参数,性能卓越
- 支持任意图像分辨率和纵横比
- 增强OCR能力,改进文档、表格、图表和图解理解
- 高级时间理解能力
- 原生捕捉视频中的音频对话和环境声音
- 支持长达3-5分钟的视频(可通过流式处理更长视频)
- 支持视频片段检索等新用例
- 改进推理和一般聊天能力
- ELO评分提高43点
- 整体质量评分从66.1%提升至72.2%
- LMSYS Chatbot Arena上ELO从1148上升到1204
- 预训练支持32种语言
- 重点支持12种主要语言
- 英语、印尼语、泰语、越南语、泰米尔语、印地语
- 阿拉伯语、日语、韩语、西班牙语、法语、意大利语
- 显著改进指令执行能力,包括多步骤指令
- 适合作为支持代理任务的构建块
- 在MegaTask基准测试中表现优异(51.8%)
- 支持函数调用,实现与用户定义函数的无缝交互
- 函数调用作为结构化输出返回
- 在遵循一般输出格式指令方面的表现从40.4%提升到83.6%