**我一直在玩** @[email protected] · Aug 02, 2023, 03:27

**我一直在玩** @[email protected] · Aug 02, 2023, 03:27

我一直在玩 @[email protected]

Aug 02, 2023, 03:27

用Whisper官方的模型跑了一下中文的语音识别，结果很奇怪，时不时会识别出“请不吝点赞订阅转发打赏支持明镜与点点栏目”，而且对应的音频位置都没有声音，再看结果又识别出一些“中文字幕由xxxx提供 ”的文本。突然意识到他们应该用了大量油管视频的音频字幕，所以会在没有声音的地方会加这种字幕内容，结果整个模型都训脏了...变成在没有声音的片段随机投放广告了otz

**EZELi0** @[email protected] · Aug 02, 2023, 08:48

**EZELi0** @[email protected] · Aug 02, 2023, 08:48

Aug 02, 2023, 08:48

EZELi0 @[email protected]

@wyzzw 遇到过与视频内容完全无关的部分，比如：“For more UN videos visit www.un.org” 、“字幕由Amara.org社区提供” 。

**我一直在玩** @[email protected] · 2023-08-02T09:25:49Z

我一直在玩 @[email protected]

@ezeli0 对，每个语种都有这种情况，可以先用VAD过滤一下没声音的部分，以及看到这个 https://github.com/EtienneAb3d/WhisperHallu

Aug 02, 2023, 09:25 · · · ·

Trending now

Resources

Developers

What is Mastodon?

alive.bar

More…