python从srt文件中只提取歌词

原始文件

在这里插入图片描述
观察只需去掉时间戳和索引号即可和换行符’\n’。
假定对话中不以0123456789等单字符开头

new = []
with open("Anne.S01E01.Your Will Shall Decide Your Destiny.WEBRip.x264-RARBG.mp4.srt", encoding="utf-8-sig") as f:				 
	for ele in f.readlines():
		if ele[0] not in list('\n0123456789'):
        	new.append(ele)
new = [ele.strip() for ele in new]

结果如图
在这里插入图片描述
如果想保存为csv文件

import pandas as pd
df = pd.DataFrame(data=new, columns=[ "text"])
df.to_csv("./text.csv", encoding="utf-8")

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值