抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

下载 bilibili 字幕文件
打开一个 bilibili 网页,鼠标右键,然后点击 “检查”

选项切换到 “Network”,然后重新打开此网页

在搜索栏中输入json 进行过滤,然后可以看到一个 后缀为.json 的文件,即为该视频对应的字幕文件。

提取字幕文件中的文本文字
首先将上述字幕文件下载到本地,然后执行如下代码,提取字幕文件中的文本内容。

1
2
3
4
5
6
7
8
9
10
11
12
import json
json_path = 'D:/System/Desktop/001.json'

# 读取 json 文件

with open(json_path, 'r', encoding='utf-8') as load_f:
content = json.load(load_f)
res = ''
body = content['body']
for data in body:
res = res + data['content'] + ','
print(res)

————————————————
版权声明:本文为CSDN博主「悄悄地努力」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_46034990/article/details/127492282

评论