首页 > 财税学习 > 财税学习 > 快手发布大模型产品“可图”,使用扩散模型以提升画质

快手发布大模型产品“可图”,使用扩散模型以提升画质

发布时间:2024-06-01 17:12:54

5月31日消息,快手自研大模型产品“可图”(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。目前,用户可以通过“可图大模型”官方网站和微信小程序,免费使用各项AI图像功能。值得注意的是,可图只需一张图片和几秒钟时间,便可生成一套AI图像。

在2024年一季度财报电话会上,快手首席执行官程一笑介绍,今年一季度,快手稳步推进自研大模型各项性能的迭代提升,并且加快大模型在各业务场景的应用。

从具体功能上看,一方面,可图提供AI形象定制功能,即图生图功能,通过人像保持技术,可保留人像的自然特征,一键生成各种风格的人像作品。目前,可图已上线10余种AI形象定制风格玩法。另一方面,快手可图大模型也提供AI创作功能,即文生图,支持用户自由输入文本,生成风格多样、创意十足的绘画作品。用户也可以上传参考图,可图将根据参考图像的风格、主题和细节等内容,生成既符合创意描述又与参考图相关的图像作品。

可图文生图作品。图|受访者供图

快手大模型团队的技术能力为产品提供了支撑。据官方介绍,“可图”大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研AI技术合成,覆盖了常见的千万级中文实体概念,还引入强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。

在画质提升方面,可图模型通过优化扩散模型的加噪去噪理论,以实现对高质量、细节丰富的图像生成的训练和推理的精准适配,引入了经过优质专家标注的图文数据集,以提升模型性能表现。

去年9月,“可图”大模型平台已在快手开启内测,快手在App评论区推出的“AI玩评”和“AI小快”等多种创新互动玩法,集合了文生图、图生图、扩图等功能,也是基于可图大模型能力。

财税学习更多>>

Win11 预览版意外播放 Windows Vista 开机声音,微软确认将修复 2025年真是小屏爆发年,从小平板到小屏手机,为啥今年大家这么喜欢小屏? 华硕ROG PG27UCDM电竞显示器限时特惠 新能源汽车下乡与基础设施投建良性互动 推动优质资源向乡村倾斜 解锁健康消费新主场!惠达进驻京东MALL,引领健康卫浴新生活 最新!湖州386个小区,二手房挂牌价曝光 广州直接取消限购,房价一夜暴涨还是暴跌,买房人到底该不该冲? iPhone 16 Pro体验:新一代钉子户神机预定 荣耀开启降价模式,Magic7跌至“新低价”,5650mAh+5000万三主摄 618各种补贴后,“最值得入手”的五款手机 华为openEuler+DeepSeek+Dify国产AI大模型【智能体】RAG应用指南 标杆企业华为如何用“AI”赋能生产力? 深入解析Go测试并行性优化:为何多核CPU无法加速你的测试? 万丽星云RTX 5070 OC 12G显卡图赏:外观全面革新,呈现流线型优雅美感 蹭图书馆的2k显示器,沉浸式双屏狂学计算机,效率爽飞 科技巨头争相布局“AI机器人赛道”,英伟达和三星据称都看上了它 人工智能“出屏” 机器人“登场” 爆款英剧《豺狼的日子》原著作者弗·福塞斯去世 青少年爱上阅读名著,如何选好一个译本? 王铎草书《为葆光张老亲翁书》 《德意志心灵》幽默笔触带你理解德意志文明的矛盾和复杂 CCTV5今日直播:07:55NBA总决赛第二场(步行者-雷霆) 二饼的直播之路:知名才艺主播的光环下,走了这么久,你变了没有 微信再上新 鸿蒙生态展现加速迭代强劲动力 商家必看!支付宝直付通如何让经营效率翻倍? 磁轴&机械轴随意切换?真正的毕业磁轴键盘!——CHERRY 双魔 B660主板最新CPU支持全名单:12/13/14代通吃,附BIOS提升技巧 柔性触觉感知公司获小米独家投资,已拿下头部主机厂、机器人企业订单 美的回应北美空调召回:系主动召回,不存在重大瑕疵和缺陷 阿尔特进军机器人产业 扩张智能科技版图