融合视觉能力,OpenAI向开发人员提供GPT-4 Turbo with Vision
2024-04-10 09:35:55AI云资讯3329
OpenAI 宣布,具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍提供。
据了解,该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库,最大的革新之处在于其新增的视觉理解能力。在过去,开发者需要调用不同的模型来处理文本和图像信息,而 GPT-4 Turbo with Vision 则将两者合二为一,极大简化了开发流程,并带来了广泛的应用前景。
OpenAI 也分享了一些开发者正在使用该模型的有趣案例。例如,AI 软件工程助手 Devin 利用 GPT-4 Turbo with Vision 辅助编程;健康健身应用程序 Healthify 使用该模型扫描用户饮食照片,通过图像识别提供营养分析;创意平台 Make Real 则利用该模型将用户的草图转化为可运行的网站。
目前,GPT-4 Turbo with Vision 尚未应用于 ChatGPT 或开放给大众使用,不过 OpenAI 暗示该功能即将登陆 ChatGPT。
相关文章
- 微软与OpenAI达成新协议,或为OpenAI上市铺平道路
- 甲骨文与OpenAI达成3000亿美元“星际之门”项目协议 或将重塑云计算与人工智能未来
- OpenAI携AI动画电影《Critterz》进军好莱坞
- 声网兄弟公司 Agora与OpenAI 携手 助力多模态 AI 智能体实现实时交互
- OpenAI或于2026年推出自研AI芯片
- 马斯克起诉OpenAI和苹果公司,指控ChatGPT和苹果应用商店非法垄断
- OpenAI对盈利模式持开放态度 ChatGPT负责人称不排除未来加入广告
- OpenAI奥尔特曼支持脑机接口公司MergeLabs,致力于实现人机智能融合
- OpenAI现场演示翻车?GPT-5发布会现神图,奥尔特曼自嘲:图表重大失误
- OpenAI推出GPT-5,奥尔特曼盛赞为写作、编程及人类级推理的最佳模型
- OpenAI发布开放权重人工智能模型:采用Apache 2.0开源协议,支持本地运行
- 生鲜电商Instacart首席执行官将于8月18日正式开始执掌OpenAI核心业务
- 耗资5000亿美元的星际之门项目因OpenAI与软银内部分歧而陷入僵局
- 领先OpenAI三个月,百度文库GenFlow支持自主调用数百Agent、多模内容并行生成,2.0版本8月上线
- OpenAI推出新款ChatGPT智能体可以操控整台电脑并完成任务
- 被Meta高薪挖角后,OpenAI拟重审薪酬体系