英雄联盟英雄台词语音音频文件整理

2020年12月03日 18270点热度 6人点赞 5条评论

最近因为博客主题稍微告一段落, 抽出时间更新一下英雄联盟英雄的音频文件, 毕竟2021年会向视频方向发展. 文件提取之间发过视频教程, 目前要解决的就是音频文件和台词对应的问题.

要做的

  • 提取全部英雄音频文件
  • 按照名字与皮肤分类
  • 台词文件对应

已经完成的

之前发发视频的时候就写了一个提取的脚本(Python), https://github.com/Virace/lol_extract_voice

全部提取

截至10.24版本, 一共152个英雄, 写的脚本用到了线程池, 我这个笔记本呢也就开到3线程, CPU就已经80多了, 用了1~2个小时才提取完毕.

切换到今年618组的那套视频剪辑用的电脑之后, 开了16线程, 仅用了十分钟. 跑了两次, 一次8线程 一次16线程, 都是十分钟. 所以感觉RExtractor.exe这个程序遇到瓶颈了. 也够快了, 就没细研究, 有兴趣看代码: https://github.com/Virace/lol_extract_voice/blob/master/Start.py

分类

这个也是简单的, 英雄名字、皮肤名字中文翻译, 游戏内的都是有的. 解包后是一个json文件, 国外有个组织叫做 CommunityDragon , 实时更新最新的联盟游戏内的这个文件的解包, 像英雄名字: https://raw.communitydragon.org/latest/plugins/rcp-be-lol-game-data/global/zh_cn/v1/champion-summary.json

所以只要写个循环, 再从对应json文件找到中文名字就OK了, 所以就有了最近更新的优化脚本: https://github.com/Virace/lol_extract_voice/blob/master/Opt.py

命名格式: 英雄英文名·英雄代号·英雄名字, 为了后期使用方便保留的所有名称. 你像以后搜索的时候ashe肯定比"艾希" 输入的快.

皮肤也一样, 保留了源文件夹名字, 然后加上皮肤名字.

台词文件对应

写了个脚本来解决这个问题. 但是没有同步到上面的库中. 可以先提供一部分看下.

for root, dirs, files in os.walk(OUT_PATH):
    if files:
        for item in files:
            if '·' in item:
                continue
            this = os.path.join(root, item)
            this_id = os.path.basename(this).split('.')[0]
            print(this)
            while True:
                winsound.PlaySound(this, winsound.SND_FILENAME|winsound.SND_ASYNC|winsound.SND_LOOP)
                i = input('请输入:')
                if i == '':
                    continue
                elif i.upper() == 'Q':
                    exit()
                else:
                    os.rename(this, os.path.join(root, f'{this_id}·{i}.wav'))
                    break

代码的意思就是循环所有文件, 然后循环播放这段音频, 人工把听到的台词输入, 之后按照输入的进行更改文件夹名字.

剑魔部分台词与音频对应文件

剑魔默认皮肤249条语音, 这249个台词对应花了近2个小时. 后来在网络中找到了部分台词, 不用手打了但是搜索还是用了很长时间.

接着想到了"语音转写", 百度等平台都有免费额度, 最后测试准确度选了讯飞的, 下面是测试结果.

阿卡丽默认皮肤部分语音

感觉还不错, 然后随机跑了100个文件继续测试. 发现了一些有趣的东西.

原台词: 只能扣动扳机的手, 还能把握什么东西

我TM直接裂开, 还有很多, 就不放图了. 测试仅仅用的是基础皮肤, 那些特殊皮肤特殊语音, 是处理过的. 直接听都很难听清的, 无解. 像厄斐琉斯, 她妹妹的语音, 真的听不懂, 就算是读音很正也不知道说的是那个字. 因为那些词没有了解过. 网上也都是网友听写的台词, 错别字很多, 又增加了额外的工作.

包括地图内NPC等一些语音在内, 共48488个文件, 整理249个文件用了两个小时, 每天24小时不睡觉, 需要半个多月才能整理完. 天真了啊.

目前进度

当前整理的是基于10.24版本的文件提取的, 抽时间看看只把基础皮肤的语音台词对应上. 绿色为完成的, 黄色为有疑问待验证的.

Aatrox·暗裔剑魔·亚托克斯
Ahri·九尾妖狐·阿狸
Akali·离群之刺·阿卡丽
Alistar·牛头酋长·阿利斯塔
Amumu·殇之木乃伊·阿木木
Anivia·冰晶凤凰·艾尼维亚
Annie·黑暗之女·安妮
Aphelios·残月之肃·厄斐琉斯
Ashe·寒冰射手·艾希
AurelionSol·铸星龙王·奥瑞利安·索尔

Azir·沙漠皇帝·阿兹尔
Bard·星界游神·巴德他没有台词 —— 2020年12月3日
Blitzcrank·蒸汽机器人·布里茨
Brand·复仇焰魂·布兰德
Braum·弗雷尔卓德之心·布隆
Caitlyn·皮城女警·凯特琳
Camille·青钢影·卡蜜尔
Cassiopeia·魔蛇之拥·卡西奥佩娅
Chogath·虚空恐惧·科加斯
Corki·英勇投弹手·库奇
Darius·诺克萨斯之手·德莱厄斯
Diana·皎月女神·黛安娜
Draven·荣耀行刑官·德莱文
DrMundo·祖安狂人·蒙多医生
Ekko·时间刺客·艾克
Elise·蜘蛛女皇·伊莉丝
—— 2020年12月5日
Evelynn·痛苦之拥·伊芙琳
Ezreal·探险家·伊泽瑞尔 —— 2020年12月8日
FiddleSticks·远古恐惧·费德提克
Fiora·无双剑姬·菲奥娜
Fizz·潮汐海灵·菲兹
Galio·正义巨像·加里奥
Gangplank·海洋之灾·普朗克

Garen·德玛西亚之力·盖伦 —— 2020年12月18日
Gnar·迷失之牙·纳尔
Gragas·酒桶·古拉加斯
Graves·法外狂徒·格雷福斯
Hecarim·战争之影·赫卡里姆
Heimerdinger·大发明家·黑默丁格
Illaoi·海兽祭司·俄洛伊
Irelia·刀锋舞者·艾瑞莉娅
—— 2020年12月29日
Ivern·翠神·艾翁
Janna·风暴之怒·迦娜
JarvanIV·德玛西亚皇子·嘉文四世
Jax·武器大师·贾克斯
Jayce·未来守护者·杰斯
Jhin·戏命师·烬
Jinx·暴走萝莉·金克丝
Kaisa·虚空之女·卡莎
Kalista·复仇之矛·卡莉丝塔
Karma·天启者·卡尔玛
Karthus·死亡颂唱者·卡尔萨斯
Kassadin·虚空行者·卡萨丁
Katarina·不祥之刃·卡特琳娜
Kayle·正义天使·凯尔
Kayn·影流之镰·凯隐
Kennen·狂暴之心·凯南
Khazix·虚空掠夺者·卡兹克
Kindred·永猎双子·千珏
Kled·暴怒骑士·克烈
KogMaw·深渊巨口·克格莫
Leblanc·诡术妖姬·乐芙兰
LeeSin·盲僧·李青
Leona·曙光女神·蕾欧娜
Lillia·含羞蓓蕾·莉莉娅
Lissandra·冰霜女巫·丽桑卓
Lucian·圣枪游侠·卢锡安
Lulu·仙灵女巫·璐璐
Lux·光辉女郎·拉克丝
Malphite·熔岩巨兽·墨菲特
Malzahar·虚空先知·玛尔扎哈
Maokai·扭曲树精·茂凯
Map·公共语音
MasterYi·无极剑圣·易
MissFortune·赏金猎人·厄运小姐
MonkeyKing·齐天大圣·孙悟空
Mordekaiser·铁铠冥魂·莫德凯撒
Morgana·堕落天使·莫甘娜
Nami·唤潮鲛姬·娜美
Nasus·沙漠死神·内瑟斯
Nautilus·深海泰坦·诺提勒斯
Neeko·万花通灵·妮蔻
Nidalee·狂野女猎手·奈德丽
Nocturne·永恒梦魇·魔腾
Nunu·雪原双子·努努和威朗普
Olaf·狂战士·奥拉夫
Orianna·发条魔灵·奥莉安娜
Ornn·山隐之焰·奥恩
Pantheon·不屈之枪·潘森
Poppy·圣锤之毅·波比
Pyke·血港鬼影·派克
Qiyana·元素女皇·奇亚娜
Quinn·德玛西亚之翼·奎因
Rakan·幻翎·洛
Rammus·披甲龙龟·拉莫斯
RekSai·虚空遁地兽·雷克塞
Renekton·荒漠屠夫·雷克顿
Rengar·傲之追猎者·雷恩加尔
Riven·放逐之刃·锐雯
Rumble·机械公敌·兰博
Ryze·符文法师·瑞兹
Samira·沙漠玫瑰·莎弥拉
Sejuani·北地之怒·瑟庄妮
Senna·涤魂圣枪·赛娜
Seraphine·星籁歌姬·萨勒芬妮
Sett·腕豪·瑟提
Shaco·恶魔小丑·萨科
Shen·暮光之眼·慎
Shyvana·龙血武姬·希瓦娜
Singed·炼金术士·辛吉德
Sion·亡灵战神·赛恩
Sivir·战争女神·希维尔
Skarner·水晶先锋·斯卡纳
Sona·琴瑟仙女·娑娜
Soraka·众星之子·索拉卡
Swain·诺克萨斯统领·斯维因
Sylas·解脱者·塞拉斯
Syndra·暗黑元首·辛德拉
TahmKench·河流之王·塔姆
Taliyah·岩雀·塔莉垭
Talon·刀锋之影·泰隆
Taric·瓦洛兰之盾·塔里克
Teemo·迅捷斥候·提莫
Thresh·魂锁典狱长·锤石
Tristana·麦林炮手·崔丝塔娜
Trundle·巨魔之王·特朗德尔
Tryndamere·蛮族之王·泰达米尔
TwistedFate·卡牌大师·崔斯特
Twitch·瘟疫之源·图奇
Udyr·兽灵行者·乌迪尔
Urgot·无畏战车·厄加特
Varus·惩戒之箭·韦鲁斯
Vayne·暗夜猎手·薇恩
Veigar·邪恶小法师·维迦
Velkoz·虚空之眼·维克兹
Viktor·机械先驱·维克托
Vi·皮城执法官·蔚
Vladimir·猩红收割者·弗拉基米尔
Volibear·不灭狂雷·沃利贝尔
Warwick·祖安怒兽·沃里克
Xayah·逆羽·霞
Xerath·远古巫灵·泽拉斯
XinZhao·德邦总管·赵信
Yasuo·疾风剑豪·亚索
Yone·封魔剑魂·永恩
Yorick·牧魂人·约里克
Yuumi·魔法猫咪·悠米
Zac·生化魔人·扎克
Zed·影流之主·劫
Ziggs·爆破鬼才·吉格斯
Zilean·时光守护者·基兰
Zoe·暮光星灵·佐伊
Zyra·荆棘之兴·婕拉

备注

在稻草人语音上卡了很久, 因为对英雄本身不了解, 大部分台词由于英雄语气以及后期特效等原因, 不管是AI听译还是人工都拉垮了. 所以从稻草人开始, 如果台词本身听译效果差的话, 决定只将实际听到的音(音译)标注在文件上.

自己开的坑, 含着泪也要走完.

文章评论

  • 啦啦啦
    2022年12月02日

    怎么下载啊大哥

  • Aiden
    2021年06月27日

    多找一点人一起人工标注也可以吧

    • 管理员
      2021年06月27日

      @Aiden 理想化是这样的,也是这样打算的。然而很多工作需要做,整理的台词收集存储更新,都需要考虑,而且为了防止重复造轮子最好是开源,还要考虑操作性。目标很大,实现比较难,只能一步一步走了。

  • 大佬
    2021年05月13日

    怎么下载啊???

    • 管理员
      2021年05月13日

      @大佬 目前后续更新方案受阻, 台词整理还没有一个合理的解决方法. 可以看一下以前的文件分享https://www.bilibili.com/video/BV1rb411v7cT/, 也可以关注一下这个B站账号, 后续处理完毕会第一时间发布新视频.