资源号

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 8472|回复: 4

组建基于百度网盘的电子书籍自动共享系统

[复制链接]

56

主题

78

帖子

4668

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4668
发表于 2020-12-7 20:08:55 | 显示全部楼层 |阅读模式
组建基于百度网盘的电子书籍自动共享系统
一、功能
1.向指定的百度网盘好友发送信息,即可获得文件名字中包含该信息的电子书籍。
二、系统构成
1.1个百度网盘账号、124小时在线服务器、百度网盘机器人
三、书籍的汇聚
1.通过网盘的“收集文件”,向网友征集电子书籍;
2.通过加百度网盘好友,点对点获得网友电子书籍;
3.通过网友提供的分享链接,转存电子书籍。
根据网友提供书籍的情况(主要是名字规则程度、数量、容量等),给予相应的积分奖励。

四、书籍的整理
1.按拼音组合 ,组建400多个基本文件夹,分组存于A~Z;
2.根据需求,组建辅助文件夹:“网友资源”、“单文件”、“文件夹”等;
3.将网友共享的资源转存在“网友资源”,基于现有书库,对其进行去重处理;
4.对去重后的资源,进行分类拆分:把有具体名字的文件夹(具体一本书或者一套书)移动到“文件夹”,把有具体名字的单个文件移动到“单文件”,直接删除没有具体名字的对象(文件夹或者文件);
5.“单文件”和“文件夹”中的对象名字进行集中规范化处理;
6.将处理好的对象按首字拼音存入相应的“基本文件夹”;
7.对基本文件夹中的单个对象进行文件夹化;
8.全部完成后,对文件索引进行系列处理及公示。
五、数据库的维护
1.对于新汇聚的资源,按去重、拆分、文件夹化的流程进行整理;
2.按更新批次创建新的文件夹,同时导入机器人;
3.不定期对机器人数据库进行一次合并优化;
4.成本预算:每年固定支出1200元(2个账号成本一年400元算,机器人一年300元,服务器一年500元),拟由维护组共同承担

-------------------
电子书籍库整理之终极任务:合并“同名”文件夹

邀请大家参与共同整理。

目前,一级目录共有23组,汉字开头的有21组。

二级目录总共是400组左右。

拟组织30位成员分组对文件夹进行“同名”合并的简化操作。

该数据库建成后,将坚持共建共维护的原则,若发现有成员对外分享,则予以除名。
凡参与过电子书资源贡献、抢救、维护的网友,均可以无偿获得该数据库。

敬请真正热爱资源汇聚、整理、共享的网友加入数据库团队。




已经创建了百度盘的共享群,参与过资源共享的,均已邀请进群。
请参与过资源共享,特别是电子书资源共享的网友,请抽空进入百度盘,在群里参与探讨。
历时3天,去重处理的主要索引数如下:
一部分电子书首次去重,重复的865万。
估计要30天左右完成去重处理。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

11

主题

27

帖子

123

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
123
发表于 2020-12-20 05:48:58 | 显示全部楼层
电子书资源会更不好整理,太多了。
回复

使用道具 举报

56

主题

78

帖子

4668

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4668
 楼主| 发表于 2021-1-4 10:52:40 | 显示全部楼层
2021-1-3 元旦期间,已经完成重复文件的去重工作,删除600多万条重复文件。

正在清理账号中的空文件夹,预计有60多万个空文件夹,已经清理了10万个,预计2021-1-10前完成空文件夹的清理。

届时,将对汇聚到的资源进行初步统计;
然后再对文件(预计还需要处理的文件数量在500万左右)进行拆分,所有没有具体名字的文件,将被集中后做移出处理。
拆分操作,可能需要30天左右的时间。
完成拆分后,将对文件名字进行规范化处理,预计需要50天。
然后再将处理好的单个文件移动到各自对应的大文件夹,预计需要10天。
再将大文件夹里的单个文件,移动到拼音文件夹里,预计需要20天。
然后对拼音文件夹里的单个文件进行文件夹化,预计需要50天左右。

以上时间是基于一切正常、并且每天16小时以上连续操作的情况。

还需要170天,每天16小时。
回复

使用道具 举报

56

主题

78

帖子

4668

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4668
 楼主| 发表于 2021-1-21 09:57:53 | 显示全部楼层
对收到的资源包进行拆分(目标):
1、有具体名字的文件夹(具体一本书或者一套书)移动到“0 文件夹”,
2、把有具体名字的单个文件移动到“0 单文件”,
3、直接删除没有具体名字的对象(文件夹或者文件)

操作流程:
1、在自己的账号上新建文件夹A 再在文件夹A下面建文件夹B
2、将资源包(譬如2-50000)转存到指定文件夹B
3、再在文件夹A下面新建两个文件夹:“0 文件夹”和“0 单文件”
4、进入文件夹“2-50000”各个路径,按要求原则将有具体书名的文件夹或者单个文件直接拖到文件夹A,有重名拖不动的,尝试拖到文件夹B,多次重复的,则在网页Web端进行移动
5、步骤4全部完全成后,在网页Web端将文件夹B里面的对象全部进行移动到文件夹A
6、将文件夹A下面拆分出来的对象,分别移动到“0 文件夹”和“0 单文件”
7、数量容量校核无误后,分享给我


回复

使用道具 举报

56

主题

78

帖子

4668

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4668
 楼主| 发表于 2021-3-15 09:20:50 | 显示全部楼层
之前拆出来的文件夹,名字已经全部规范化,并且移动到了一级目录中。

部分字母(ABZ)中的文件夹,已经移动动了二级目录中。

目前正在对单个文件的名字进行规范化处理,并分批移动到相应二级目录中。

移动目前分四类:
1、原来已经移动太一级目录的,要先移动到集中的一个文件夹;
2、单个文件夹数量较小的,移动到集中的一个文件夹;
3、单个文件夹数量较多的,单独移动到二级目录;
4、将集中文件夹里的文件分批移动到二级目录。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|资源号 ( ziyuanhao.com )

GMT+8, 2024-11-23 17:36 , Processed in 0.038538 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表