腾讯,大动作

2024-12-04 16:23来源: 中国经济网

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  12月3日下午,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后,混元大模型又一进展。同时,腾讯宣布开源该视频生成大模型,参数量130亿。

  开放申请测试

  “用户只需要输入一段描述,即可生成视频。”腾讯混元相关负责人透露,目前生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。该模型已上线腾讯元宝APP,用户可在AI应用中的“AI视频”板块申请试用。企业客户通过腾讯云提供服务接入,目前API同步开放内测申请。

  在现场演示环节,演示视频中出现的冲浪、跳舞等大幅度运动画面,运动镜头及人物未发生形变。

  腾讯混元相关负责人介绍,腾讯混元生成视频大模型可实现超写实画质、生成高度符合提示词的视频画面,画面流畅不易变形。光影反射基本符合物理规律,在镜面或者照镜子场景中,可以做到镜面内外动作一致。同时,模型还可以实现在画面主角保持不变的情况下自动切镜头。

  全面开源

  据了解,腾讯混元生成视频大模型基于DiT架构,并在架构设计上进行多处升级。混元视频生成模型适配了新一代文本编码器提升语义遵循,其具备语义跟随能力,更好地应对多个主体描绘,实现更加细致的指令和画面呈现。同时,采用统一的全注意力机制,使得每帧视频的衔接更为流畅,并能实现主体一致的多视角镜头切换;通过先进的图像视频混合VAE(3D 变分编码器),让模型在细节表现有明显提升,特别是小人脸、高速镜头等场景。

  目前,腾讯宣布开源该视频生成大模型已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。基于腾讯混元的开源模型,开发者及企业无需从头训练,即可直接用于推理,并可基于腾讯混元系列打造专属应用及服务,能够节约大量人力及算力,加速行业创新步伐。

  从年初以来,腾讯混元系列模型的开源速度不断加快。此前,腾讯混元已经开源了旗下文生文、文生图和3D生成大模型。至此,腾讯混元系列大模型已实现全面开源。

  转自:中国证券报微信

[责任编辑: ]
阅读剩余全文(
为你推荐
这是11月5日在科威特首都科威特城拍摄的“超级月亮”和一架飞机。当日,“超级月亮”现身天宇。当日,“超级月亮”现身天宇。当日,“超级月亮”现身天宇。当日,“超级月亮”现身天宇。
06
这是11月4日在宁夏青铜峡库区湿地自然保护区内拍摄的麋鹿和麋鹿幼崽(右)。青铜峡库区湿地自然保护区总面积174.93平方公里,是宁夏最大的黄河滩涂类型湿地。青铜峡库区湿地自然保护区总面积174.93平方公里,是宁夏最大的黄河滩涂类型湿地。
06
立冬将至,全国各地秋意仍浓,以斑斓色彩迎接冬天到来。立冬将至,全国各地秋意仍浓,以斑斓色彩迎接冬天到来。立冬将至,全国各地秋意仍浓,以斑斓色彩迎接冬天到来。立冬将至,全国各地秋意仍浓,以斑斓色彩迎接冬天到来。
06
随着夜幕降临,河道两岸灯光点缀,乌篷船缓缓划过,水面映射出绚丽色彩。当暮色浸染白墙黛瓦,乌镇从素简水墨画蜕变为流光溢彩的数字梦境。
05
11月5日将迎来本年度第二次“超级月亮”。这是2025年三次“超级月亮”中离地球最近的一次,也是年度最大满月。“超级月亮”即“近地点满月”,就是满月时月球位于近地点附近。
05
11月4日,中国大熊猫保护研究中心卧龙神树坪和都江堰基地的13只熊猫搬入新启用的绵阳基地“新家”,这标志着历时3年建成的中国大熊猫保护研究中心绵阳基地投入试运行,中心在都江堰、卧龙、雅安之外,又添绵阳一座基地。
05
届中国国际进口博览会即将于11月5日在上海拉开帷幕,目前进博会举办地国家会展中心(上海)各项展前准备工作有序推进,静待盛会。届中国国际进口博览会即将于11月5日在上海拉开帷幕,目前进博会举办地国家会展中心(上海)各项展前准备工作有序推进,静待盛会。
04
“九重之下——故宫造办处旧址考古成果展”将于2025年11月4日至2026年2月8日在故宫永寿宫展厅举行,并免费向公众开放。“九重之下——故宫造办处旧址考古成果展”将于2025年11月4日至2026年2月8日在故宫永寿宫展厅举行,并免费向公众开放。
04
11月3日,农民驾驶农机在江苏省兴化市兴东镇周韩村田间施肥,为冬小麦播种做准备(无人机照片)。记者11月3日从农业农村部了解到,截至10月30日,全国秋粮收获过九成,冬小麦播种过两成半。
04
载入更多资讯
返回
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮