融合视觉能力,OpenAI向开发人员提供GPT-4 Turbo with Vision
2024-04-10 09:35:55AI云资讯3396
OpenAI 宣布,具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍提供。
据了解,该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库,最大的革新之处在于其新增的视觉理解能力。在过去,开发者需要调用不同的模型来处理文本和图像信息,而 GPT-4 Turbo with Vision 则将两者合二为一,极大简化了开发流程,并带来了广泛的应用前景。
OpenAI 也分享了一些开发者正在使用该模型的有趣案例。例如,AI 软件工程助手 Devin 利用 GPT-4 Turbo with Vision 辅助编程;健康健身应用程序 Healthify 使用该模型扫描用户饮食照片,通过图像识别提供营养分析;创意平台 Make Real 则利用该模型将用户的草图转化为可运行的网站。
目前,GPT-4 Turbo with Vision 尚未应用于 ChatGPT 或开放给大众使用,不过 OpenAI 暗示该功能即将登陆 ChatGPT。
相关文章
- OpenAI推出全新旗舰级图像生成模型GPT Image 1.5
- 英伟达在AI图形处理器上部署训练OpenAI的GPT-5.2,为人工智能产业提速
- 算力帝国的双重博弈:解码OpenAI在英伟达与AMD之间的16GW战略布局
- OpenAI宣布进入“红色警报”状态,谷歌在人工智能领域加速追赶
- Checkout.com 启用 OpenAI 智能体电商协议,赋能全球企业商户
- OpenAI在ChatGPT中推出群聊功能
- OpenAI正式发布GPT-5.1,ChatGPT可提供8种对话模式
- OpenAI在安卓平台推出Sora应用
- OpenAI与亚马逊达成380亿美元AI训练合作协议
- OpenAI完成营利性重组,并与微软达成了新协议
- OpenAI推出新款AI网页浏览器ChatGPT Atlas
- 日本要求OpenAI停止盗用漫画和动漫内容
- OpenAI与博通合作生产自研AI芯片,英伟达独占市场的局面将逐步打破
- OpenAI的Sora 5天下载量已突破100万次,增速超ChatGPT
- OpenAI推出新款社交视频应用:可对好友进行深度模仿
- 微软携手OpenAI的竞争对手Anthropic,共同提升Microsoft 365应用效能









