豆包文生图能力升级 支持一键生成含指定文字图片
2024-12-07 22:00:19AI云资讯7557
近日,字节跳动旗下智能AI助手豆包升级文生图能力,支持一键生成指定文本。用户可以在生图提示词中加入文本要求,如“一张带有「新年快乐」的图”,即可生成带有指定文字的图片。目前该功能已经在豆包APP开启测试,即梦也已小范围测试。

(用豆包生成带有文字的图片)
对文生图模型而言,如何在图像中精准生成文本一直是难题,尤其是中文文字,经常出现乱码。据介绍,相比英文字母,汉字字符结构更复杂,且字符数量要多两个数量级。豆包大模型团队相关负责人表示,豆包文生图模型通过打通LLM和DIT构架,具备更好的原生中文数据学习能力,并在此基础上强化了汉字生成能力,大幅提升了生成效果。
据观察,已有不少用户尝试使用该能力制作表情包、梗图漫画,或辅助生成海报,并在社交媒体平台发布。据介绍,当前该功能仅支持文生图时添加文字,暂不支持上传图片生成文字。
豆包负责人表示,该能力刚刚推出,仍在完善和优化中。目前绝大多数情况下豆包能够准确生成指定文字,但仍存在少部分错字、漏字或小字乱码等情况。“不管文字、图片、还是音乐生成功能,豆包都希望能够降低创作门槛,帮助人们更好地表达和创造。”据悉,豆包网页及电脑版也将在近期上线该能力。
豆包是字节跳动基于豆包大模型推出的AI智能助手,支持手机App、PC 电脑版、网页版、浏览器插件。作为全能AI 助手,豆包能为生活、学习、工作提供帮助。用户可以通过豆包搜索信息,答疑解惑,分析总结,提供灵感,辅助创作,提高生活和学习效率。
相关文章
- 又一量产车型落地!奔驰纯电 GLC 全面接入豆包大模型
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 凤凰卫视×火山引擎:达成深度合作!豆包大模型助力媒体智能升级
- 瑞声科技:豆包 AI手机核心供应商,合作多家海外大模型企业
- 升级版“蓝心小V”亮相,豆包大模型助力vivo打造AI原生体验
- 接入豆包大模型,酷开OTT大屏的花式玩法
- 豆包·同声传译模型2.0来了:3s延迟,实时声音复刻
- 飞书发布知识问答等多款AI产品 让企业拥有懂自己的“豆包”
- 接入豆包大模型,巨人网络解锁《太空杀》AI游戏玩法新高度
- 豆包大模型1.6发布!更强模型、更高性价比
- 字节豆包视频模型Seedance 1.0首次登顶全球视频生成竞技榜
- 中文大模型幻觉测评:豆包大模型准确率全球第一,超越DeepSeek-R1、Gemini-2.5、GPT-4o
- Flat Ads:透视中国AI出海战略,看豆包、腾讯元宝、美图相机如何占领市场先机
- 涂鸦智能集成DeepSeek、豆包、OpenAI等全球先进AI大模型,发布亿元补贴助力AI硬件创新
- “言出图随”:三星绘图助手解锁图像创作的“豆包解法”
- 豆包实时语音大模型登场,谁是概念股中的 “潜力黑马”?
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









