创建了一个微信公众号 推书君, 把这个推荐系统集成了,方便使用。后期有空可能会加一些新功能
周末花了一天时间制作了 推书君 的微信和 QQ 小程序版本,因为原生用的 vuejs,所以选了支持 vuejs 的 uniapp 小程序框架,整体感觉还是比较顺利的。小程序整体体验确实不错,比 web 顺滑很多。
1
guonning 2016-09-25 14:12:51 +08:00 via Android
很好,喜欢网文。希望可以解决书荒问题
|
2
guonning 2016-09-25 14:14:26 +08:00 via Android
希望可以把代码分享出来
|
3
hl284975274 2016-09-25 14:24:39 +08:00 via iPad
好思路!希望代码分享在 github 大家一块改进!
|
4
Abirdcfly 2016-09-25 14:56:20 +08:00 via iPhone
出乎意料的好。测试几本书的结果和我人脑推荐结果差不多。
|
5
miyuki 2016-09-25 15:06:29 +08:00
感觉挺准的
|
6
qfdk 2016-09-25 15:06:36 +08:00 via iPhone
求源码 spark 的么
|
7
zxcasdqwe9 2016-09-25 15:11:04 +08:00
建议结果列表的书名可以直接点击继续搜索
|
8
Wyatt 2016-09-25 15:13:25 +08:00
|
9
Wyatt 2016-09-25 15:14:05 +08:00
无视上条,回复错了 QAQ
|
10
zxcasdqwe9 2016-09-25 15:18:20 +08:00
搜《新宋》的结果很奇怪啊
|
11
zxcasdqwe9 2016-09-25 15:21:42 +08:00
书籍重名的搜索结果需要优化
|
12
shidenggui OP @zxcasdqwe9 为了简化结果,重名的书籍应该是都给我丢弃了
|
13
mrfox 2016-09-25 15:30:27 +08:00 via Android
试了,书名包括英文就无结果
|
14
Troevil 2016-09-25 15:30:59 +08:00
是根据关键词来的吧
|
15
hit410 2016-09-25 15:36:51 +08:00 via Android
感觉很不错
|
16
gimp 2016-09-25 15:45:34 +08:00
很棒!
|
17
mosbic 2016-09-25 16:17:42 +08:00 via Android
棒!!
|
18
nladuo 2016-09-25 16:21:06 +08:00 via iPhone
好东西,有时间自己也写一个。
|
19
kikyous 2016-09-25 16:31:43 +08:00
不错,希望能开源学习学习
|
20
lujun9972 2016-09-25 16:33:08 +08:00 via Android 1
请问数据从哪爬下来的?
|
21
shierji 2016-09-25 16:36:39 +08:00 via Android
楼主 阿里布达年代祭都没有……
|
22
haiyang416 2016-09-25 17:14:06 +08:00 via Android
依据什么做的相似性对比?
|
23
yyyyyyyhb 2016-09-25 18:22:01 +08:00
搜索一本小说结果里还有这本小说
|
24
lcorange 2016-09-25 19:25:10 +08:00
还不错,我搜了一本喜欢的,答案前十本都一样都很喜欢,还都看过
|
25
kenken 2016-09-25 20:04:53 +08:00
不错。
|
27
iA7489 2016-09-25 20:13:02 +08:00 via iPhone
相当符合
赞一个 |
28
dlsflh 2016-09-25 20:15:26 +08:00
使用了一下感觉还不错,用了才发现原来大家调侃的“霸道总裁爱上我”并不存在啊!
支持楼主! |
29
wyx 2016-09-25 20:20:17 +08:00
速度好快啊
|
30
kamen 2016-09-25 22:40:41 +08:00
很不错啊,提个建议,做一个自定义排序和分类选择会更好
|
31
kamen 2016-09-25 22:42:28 +08:00
建议放到 git 上,大家一起出力
|
32
a87150 2016-09-25 23:00:37 +08:00
感觉只是单纯把有名的凑在一起,史上第一混乱和无限恐怖的相似度居然比和都市妖奇谈还高。
异常生物见闻录以及张小花其他作品(除了我就是妖怪)这些明显更相似的居然没有出现。 |
33
ipconfiger 2016-09-25 23:07:35 +08:00
输入后宫, 失败
输入穿越, 失败 感觉, 毫无用处 |
34
a570295535 2016-09-25 23:14:30 +08:00
加载速度太快了,牛啊,书的数据从哪爬下来的哇?建议把代码放到 git 上,大家一起出力,做出更精准的网文推荐系统。。。
|
35
clearbug 2016-09-25 23:22:23 +08:00 via Android
不明白上面为啥辣么多称赞的。。为啥我搜的书都木有:龙族,黑客与画家,人月神话。。。难道数据都是作者自己搜集后放到自己数据库的
|
37
est 2016-09-25 23:43:06 +08:00
赞。
|
38
tscat 2016-09-26 00:14:13 +08:00 via iPhone
手里有个 sobook.org
|
39
wizardforcel 2016-09-26 00:16:29 +08:00 via Android
你都收录了悟空传居然不收录龙族??
|
40
hatcloud 2016-09-26 00:21:00 +08:00 via iPhone
@wizardforcel 龙族不是网文
|
41
yzongyue 2016-09-26 00:42:21 +08:00 via Android
不错
|
42
icylogic 2016-09-26 01:23:37 +08:00
感觉还挺准。
如果多本同时匹配就更好了。 还有往复杂做的思路,就是建立账号系统然后像网易一样有书单,可做的事就多了。 当然现在简洁一点也挺好。 |
43
Yinz 2016-09-26 01:27:29 +08:00
猜一猜原理,从各大小说站抓小说的分类标签,然后对标签向量算余弦距离这样?:D
|
44
gzlock 2016-09-26 02:18:25 +08:00
然而楼主发个帖就跑了
|
45
kakay 2016-09-26 08:59:42 +08:00
竟然没有飘渺之旅
|
46
cosgbgas 2016-09-26 09:02:22 +08:00
看见 幽冥仙途 减肥的确是我的大爱。
|
47
shidenggui OP @kakay 飘邈之旅
|
48
quericy 2016-09-26 09:19:40 +08:00
|
49
shidenggui OP @quericy 修复了,现在应该有了。你再搜下看看
|
50
timeship 2016-09-26 09:41:18 +08:00 1
还行,测试了几个,还蛮准的。喜欢看雪中悍刀行,匹配到了老猫和烟男的几本书
|
51
wandero 2016-09-26 09:49:38 +08:00
赞,简单试用了下,发现乱臣贼子的类似收了猛兽记,虽然都是好书,但这两不搭边
然后收了习惯呕吐的求索这一足球小说,反而却没有作者的陌上行这种真正类似的架空 书荒还是推荐优书网 能看到这楼的都是同好, 我的优书网书单 http://www.yousuu.com/user/914383 我的个人书单站点 http://novo.cloudlet.info lz 加油,我就想过弄出一个可以根据个人全部书目评分评估个人口味,然后推符合个人喜好的书单的书目站,不过代码盲也只能想一想了 |
52
shidenggui OP @wandero 这是下一步的计划,不过最近估计没时间弄。弄这个 demo 花了我 2 天多的时间,后面有机会在把按用户的加上
|
53
lcatt 2016-09-26 10:13:47 +08:00
亵渎不匹配 永夜君王。。。。
|
54
jasonding 2016-09-26 10:15:33 +08:00
这个不错,以后不担心书荒了,哈哈
|
55
jasonding 2016-09-26 10:20:47 +08:00
个人建议可以添加字数范围过滤,以及简单的硬分类,什么科幻、穿越、都市、重生等等,使用体验会更好点
|
57
shidenggui OP @Zzzzzzzzz 恩,我在龙空也发过帖子,不过龙空的管理者貌似觉得这些推荐没啥用。。。
|
58
geew 2016-09-26 10:30:55 +08:00
可以 |
59
yuhuigreed 2016-09-26 10:35:48 +08:00
用了下感觉推荐的还可以
|
61
cenxun 2016-09-26 11:37:16 +08:00
狩魔手记赞一个
|
62
nkchivas 2016-09-26 11:49:33 +08:00
相当有效率
|
63
scorpius 2016-09-26 11:52:44 +08:00
感觉推荐的不错 楼主棒棒的 加油!
|
64
NARUTOzp 2016-09-26 11:55:38 +08:00
看到 daocloud ,顶一下
|
65
CuminLo 2016-09-26 12:27:59 +08:00
那么问题来了,可以做成动漫推荐么?
|
66
xzg1993 2016-09-26 12:38:46 +08:00
真棒~~
|
67
paledream 2016-09-26 13:22:51 +08:00
很棒,看楼主的头像似乎是吸血鬼猎人 D 😄
|
68
aeshfawre 2016-09-26 13:28:54 +08:00
|
69
shidenggui OP @paledream 烙印战士
|
70
paledream 2016-09-26 13:37:38 +08:00
@shidenggui 原来是剑风传奇,眼拙了,哈哈哈哈
|
71
shidenggui OP @NARUTOzp daocloud 更新容器要好久,给客服提了意见还没回复。我们自己部署的 jenkins 用 docker 更新非常快
|
72
xxxsicong 2016-09-26 15:42:09 +08:00
卧槽有点准
|
73
zpfhbyx 2016-09-26 16:25:32 +08:00
其实我更想知道相似算法,:) 捂脸,逃
|
74
sunyang 2016-09-26 17:27:54 +08:00 via iPhone
很准 随便打了一本喜欢的书 推荐的都是我喜欢看的
|
75
shunia 2016-09-26 18:02:09 +08:00
这个我是服的
|
76
livc 2016-09-26 22:16:55 +08:00
网文居然有这么多人看啊。。
|
77
mingyun 2016-09-26 22:49:03 +08:00
赞楼主
|
78
shahua365 2016-09-27 09:01:52 +08:00
大赞,希望能做到多本书匹配,然后推荐类似的书籍
|
79
shidenggui OP @shahua365 这是下一步的方向,看看怎么弄比较好
|
80
awolfly9 2016-09-27 17:10:41 +08:00
@shidenggui 现在这个只是能够匹配网文?如果能够做到匹配所有书籍,包括散文、叙事,甚至技术书籍的话,用的人会应该会很多的
|
81
millken 2016-09-27 17:12:21 +08:00
《被生活网住的人生》
这部类似的没有么? |
82
shidenggui OP |
83
awolfly9 2016-09-27 18:15:57 +08:00
@shidenggui 可以试试抓取豆瓣的数据,利用他的数据库来做匹配,当然也可以抓取一次然后存取成自己的数据,不过我不知道你是怎么实现的
|
84
cszhiyue 2016-09-27 18:51:57 +08:00
@awolfly9 @shidenggui 楼主已经大概说了。个人不负责任的猜测应该是把网文的原文下载下载,分词,然后计算余弦相似度。豆瓣的数据知识一些评论和 tag ,应该达不到要求。
挺有意思的想法,目前也尝试做一下玩玩。 |
85
awolfly9 2016-09-27 19:02:30 +08:00
|
87
oulongqi 2016-09-27 21:04:04 +08:00
很多词都搜不到哦,可以考虑先把词语丢到小说网站网随便拿几个接过来冷启动一下。
|
88
solobat 2016-09-27 22:40:17 +08:00
哈哈, 赞楼主. 之前我也把优书网的书爬到 leancloud 上, 还没来得及用呢.
|
89
shidenggui OP @solobat 最开始本来想用 leancloud 的,后来看到 daocloud 貌似有免费送的 2x 容器,就试用了下。现在这些云服务太方便了,开发个东西,几个小时就搞定了
|
92
Sukizen 2016-09-29 09:05:44 +08:00
楼主在哪里,有个项目想找你谈谈
|
93
ijustdo 2016-09-29 09:28:58 +08:00
1. 字数格式化 多少万字
2. 点击作者 可以搜索 同作者的相似书记 3. 点击下面任意书名 搜索点击的书名 还有就是书的量不够咧 找了好几个都没有 |
94
ijustdo 2016-09-29 09:35:31 +08:00
数据量不够啊 哈哈
多抓几个站 然后 标签建库 通一本书 如果多个站出现的相同标签加权 然后用常用词库 分词 再建一些 常用词的 向量库 到时候出了放出书名 搜索 关键词搜索 还可以放排行 如果爬虫过关 还可出热门.... 有点小意思 找个小说网站卖了吧 |
95
shidenggui OP @Sukizen https://github.com/shidenggui , 主页有邮箱
|
96
shidenggui OP @ijustdo 谢谢思路,不过这样搞工程浩大,我也就是好玩弄了个 demo
|
97
vlike 2016-09-29 21:27:21 +08:00 via Android
感觉不错,可以介绍一下实现的原理及工具吗?
|
98
bravecarrot 2016-10-03 12:24:33 +08:00 via iPhone
楼主选取的特征有哪些?
|
99
mfanming 2016-10-06 09:27:01 +08:00
没有白鹿原
|
100
alouha 2016-10-24 18:35:53 +08:00
额,从零开始这本书都木有,好奇楼主的算法,希望能放到 github 上
|