利用urllib3 抓取博客列表

二分查找算法(折半查找算法)

  返回  

(Python)BiliBili(手机端缓存视频转换)

2021/8/21 16:10:29 浏览:

目录

需求

功能实现分析

需要进行的操作

使用到的技术:Python基础和ffepeg

需求分析(一个简单的思维导图)

源代码

总结反思:


需求

 这一个将b站手机端缓存直接转换为可以直接打开的视频的软件。 用户在Config里面设置好之后,运行程序即可实现自动转换。(这里我将Config里的设置直接复制到了代码最上方)

功能实现分析

转换规则:

1.总视频文件夹
外面的纯数字是普通视频
纯数字代表视频的av号
s_开头的是番剧类型的视频
    
2.剧集文件夹
点开av号的文件夹,里面的c_开头的是视频的cid
    
3.视频信息文件夹
点开cid的文件夹,entry.json里面是视频的json信息,里面有视频标题,av号(avid)bv号(bvid)还有分p信息(page_data,里面有视频的cid和分p的名字)还有视频的清晰度代号(比如80代表1080P)
danmaku.xml是视频的xml弹幕。
    
4.视频文件夹
点开清晰度代号文件夹,里面有audio.m4s和video.m4s,这种情况用ffmpeg进行合并:
ffmpeg -i "audio.m4s" -i "video.m4s" "output.mp4"
这样就能直接合并为MP4文件。
    
对于blv文件,也是使用ffmpeg直接封装为MP4:
ffmpeg -i "0.blv" -acodec copy -vcodec copy "output.mp4"
要注意,ffmpeg对中文支持不是很好,尽量不要在命令行直接使用中文命名,而是完成操作之后软件重命名。    

需要进行的操作

1.打开总文件夹,通过命名将视频进行分类(3类,番剧类,普通视频分P类,普通单P视频)

2.将每一个视频进行解析。进入视频json文件中解析视频信息,从中找到命名信息。

3.将每一个视频中的视频文件转化为MP4文件,bilibili里的视频文件分为两种(一种为音频和视频分开的两个m4s文件,一种为blv文件,均不能直接播放)

使用到的技术:Python基础和ffepeg

需求分析(一个简单的思维导图)

 

源代码

import json
import os
​
# bilibili缓存视频地址
input_path = "C:/Users/Promise/Desktop/download"
# 保存视频文件夹
out_path = 'C:/Users/Promise/Desktop/bili_video'
# 是否转换普通视频类文件
c_video = True
# 是否转换番剧类文件
c_anime = True
# 番剧转换是否放在同一个文件夹(类似唧唧的批量下载)
anime_folder = True
# 多个分P的视频是否放在同一个文件夹
video_folder = True
# 是否输出xml弹幕
c_xml = True
# 是否把xml弹幕转换为ass弹幕
xml2ass=True
# 是否使用唧唧Down的命名规则,如果为False则使用视频的cid命名
enable_JJDown_rename = True
# 转换完成后是否删除源文件
delete_input_file = False
​
# 打开总文件夹
def open_download():
​
    # 所有缓存视频
    all_video = os.listdir(input_path)
    # 补全路径
    list = []
    for video in all_video:
        video = input_path + '/' +video
        list.append(video)
    return list
​
# 判断大类型
def judge_huge_type(video):
    # 根据文件命名判断类型
    if 's_' in video:
        type = 's'
        return type
    else:
        type = 'c'
        return type
​
# 判断普通视频是否分P
def c_judge_p(video_path):
    # 根据路径打开文件夹
    # 根据文件数量判断是否分P
    sub_video_list = os.listdir(video_path)
​
    if len(sub_video_list) > 1:
        return True
    else:
        return False
​
def sub_file(video_path):
    # 根据路径打开剧集文件夹
    # 根据文件数量判断是否分P
    sub_video_list = os.listdir(video_path)
    sub_list = []
    for sub_video in sub_video_list:
        sub_video = video_path+ '/' +sub_video
        sub_list.append(sub_video)
    return sub_list
​
def subsub_file(sub_video_path):
    # 根据剧集路径进入每一集信息文件夹
    subsub_video_info = os.listdir(sub_video_path)
    video_info = []
    for fileinfo in subsub_video_info:
        fileinfo = sub_video_path + '/' +fileinfo
        video_info.append(fileinfo)
    return video_info
​
def get_name(video_info):
    # 获取名称
    for video_file_info in video_info:
        if str(video_file_info).endswith('json'):
            with open(video_file_info, 'r', encoding='utf8') as out:
                json_data = json.load(out)
                # print(json_data['title'])
    return json_data['title']
​
def get_anime_index(video_info):
    # 获取番剧剧集信息
    for video_file_info in video_info:
        if str(video_file_info).endswith('json'):
            with open(video_file_info, 'r', encoding='utf8') as out:
                json_data = json.load(out)
                info =  json_data['ep']
                result = info['index']+' '+info['index_title']
​
    return result
​
def get_pages_index(video_info):
    # 获取分P视频信息
    for video_file_info in video_info:
        if str(video_file_info).endswith('json'):
            with open(video_file_info, 'r', encoding='utf8') as out:
                json_data = json.load(out)
                info = json_data['page_data']
                result = info['part']
​
    return result
​
def last_file(video_info):
    # 进入最后一个文件夹
    last_list = []
    for video_file_info in video_info:
        if  not str(video_file_info).endswith('json') and not str(video_file_info).endswith('xml') :
            last_file_list = os.listdir(video_file_info)
            for last_file_info in last_file_list:
                last_file_info = video_file_info + '/' +last_file_info
                last_list.append(last_file_info)
​
    return last_list
​
​
def convert_mp4(last_list,last_file_path):
    # 将两个m4s文件转换为MP4文件
    m4s_count = 0
    blv_count = 0
    m4sfile_list = []
    blvfile_list = []
    for last_file in last_list:
        if str(last_file).endswith('m4s'):
            m4sfile_list.append(last_file)
            m4s_count += 1
        elif str(last_file).endswith('blv'):
            blvfile_list.append(last_file)
            blv_count += 1
        else:
            pass
    if m4s_count  == 2:
        os.system('ffmpeg -i ' + '"' + m4sfile_list[0] + '" ' + '-i' + ' "' + m4sfile_list[1] + '" -acodec copy -vcodec copy ' + '"' + last_file_path + '"')
    elif blv_count == 1:
        os.system('ffmpeg -i ' + '"' + blvfile_list[0] + '"' + ' -acodec copy -vcodec copy ' + '"' + last_file_path + '"')
    else:
        pass
    print(last_file_path , '转换成功!')
​
​
​
​
if __name__ == '__main__':
    # 打开视频文件夹
    all_video = open_download()
    # 遍历视频文件夹
    for video in all_video:
        # 判断视频类型(番剧还是普通视频)
        type = judge_huge_type(video)
        if type == 's':
            print('番剧')
            #  如果设置中打开转换番剧为True
            if c_anime:
                # 打开剧集文件夹
                all_sub_video= sub_file(video)
                # 遍历剧集文件夹
                for sub_video in all_sub_video:
                    # 打开每一集视频信息文件夹
                    video_info = subsub_file(sub_video)
                    # 从json文件中取出视频相关信息
                    # 视频名称
                    name = get_name(video_info)
                    # 剧集名称
                    index_name =  get_anime_index(video_info)
                    # 保存位置
                    save_dirpath = out_path
                    # 如果番剧保存需要零开一个文件夹
                    if anime_folder:
                        # 添加一个由番剧名称组成的文件夹
                        save_dirpath = out_path + '/' + name
                        # 创建文件夹
                        if not os.path.exists(save_dirpath):
                            os.mkdir(save_dirpath)
                    # 写最终文件路径
                    last_file_path = save_dirpath + '/' + index_name + '.mp4'
                    last_list = last_file(video_info)
                    # 转换文件格式
                    convert_mp4(last_list, last_file_path)
​
​
        else:
            print('普通')
            # 同上
            if c_video:
                if c_judge_p(video):
                    print('分p')
                    all_sub_video = sub_file(video)
                    for sub_video in all_sub_video:
                        video_info = subsub_file(sub_video)
​
                        name = get_name(video_info)
                        index_name = get_pages_index(video_info)
                        save_dirpath = out_path
                        if video_folder:
                            save_dirpath = out_path + '/' + name
                            if not os.path.exists(save_dirpath):
                                os.mkdir(save_dirpath)
​
                        last_file_path = save_dirpath + '/' +index_name +'.mp4'
                        last_list = last_file(video_info)
                        convert_mp4(last_list,last_file_path)
​
                else:
                    # 同上
                    all_sub_video = sub_file(video)
                    for sub_video in all_sub_video:
                        video_info = subsub_file(sub_video)
​
                        name = get_name(video_info)
                        last_file_path = out_path + '/' + name + '.mp4'
​
                        last_list = last_file(video_info)
                        convert_mp4(last_list, last_file_path)
​

总结反思:

1.感觉这个代码还是尽力封装了许多函数,但是main函数还是太长了,封装的效果也不太好,希望接下来可以改进。

2.代码长了容易记不住名字,所以需要更加规范的命名原则。

3.最后一个for循环里的功能有些可以继续封装,但是还是有点懒,最后没有改进。

4.所有可以进行封装的功能还是要尽量封装,也让代码有更高的可读性。

满怀希望就会所向披靡!

                                                                                        一位刚在CSDN发表文章的Python小萌新

联系我们

如果您对我们的服务有兴趣,请及时和我们联系!

服务热线:18288888888
座机:18288888888
传真:
邮箱:888888@qq.com
地址:郑州市文化路红专路93号