最近,Hedra Labs推出了Character-1的研究预览版,该技术允许用户根据任意人物照片和语音内容生成个人说话和唱歌的动态视频。
想象一下,你上传一张人物照片,再配上任意的语音内容,瞬间就能生成一段动态视频,让照片中的人物仿佛有了生命,开始说话或者唱歌,而且唇形、表情、姿态都和语音内容完美匹配!是不是有点小激动呢?
Hedra Labs官方演示视频
主要特性和功能亮点:
多平台兼容性:无论是桌面还是移动设备,用户都可以轻松使用Character-1。
无限时长生成:目前开放预览版支持30秒的视频生成,如果H100供应充足,每60秒可生成90秒的内容。
支持多种表达形式:Character-1不仅支持对话,还能处理歌唱和说唱等表达形式。
Hedra提供了一个用户友好的界面,即使是非专业人士也能快速上手。用户可以访问Hedra的官网,通过文字转语音功能或直接上传音频文件,输入角色描述,然后生成动态视频。
Hedra的AI技术确保了视频内容的高质量和逼真度,无论是人物的表情、姿态还是语音的同步性,都能达到令人满意的效果。
从官方提供的案例来看,Character-1可以完美演绎唱歌、演戏以及表现不同情绪的角色。该技术不仅限于人类角色,甚至还能生成表现丰富的无生命物体,只要这些物体具有明显的面部特征。
使用方法也非常简单,具体步骤如下:
打开hedra体验地址:https://top.aibase.com/tool/hedra
进入页面后可以看到这个操作界面
界面很简单,第一个框输入你的角色台词,并选择一个声音,当然如果你不想用生成的音频也可以导入自己的音频
在这里我简单输入一句“哈啰,这是由AIbase创建的说话视频,今天带大家体验一下Hedra,让视频生成变得像呼吸一样简单”。
然后在第二个框上传我想要说话的图片,这里上传一张我之前制作的美女写真。
没有现成图片的也可以直接在下面的文字框中输入你的角色,并点击创建来生成。
图片上传完成后,在第三个框下方点击生成视频即可。
下面是生成的视频效果:
可以看到,Hedra生成的说话视频,人物是比较灵动的,不是只有嘴巴动,身体的其他部位也会动,而且还会有表情。不过由于平台可供选择的声音很少,老外的口音和我的图片人物不是很搭,还有一个美中不足的是,生成后的视频要比我原图模糊了不少,希望平台后续提升一下画质。
这里我自己上传一段音频,音频我直接用剪映生成,选择了一个女生的音色,直接输入文本然后朗读。
重新测试一下:
选择导入音频
生成效果如下:
然后模糊的问题可以使用krea ai的视频增强功能解决,不过要注意,免费体验的,视频时长不能超过10秒,超过的只能自己裁剪一下了。而且帧率不要选太高,我选的60帧每秒,弄到一半要付费升级了,哭晕在厕所~