encn
2024 年1 月 4 日 01:04
1
整合一些热门美剧的 html 剧本,索引之后 ,制作成 mdx,全文搜索。
搜索结果必须包含上下文:
CHANDLER: Ya know Phoebs, don't feel so bad for 'em. After they're done playing, I break out the little plastic women and everybody has a pretty good time.
PHOEBE: Why don't you play with your roommate?
CHANDLER: Ah he's a, he's not a big fan of foosball.
PHOEBE: Uh oh, ooh, are we not getting along with the new boy?
— Friends.S02.018
7 个赞
Howie
2024 年1 月 4 日 02:40
2
我记得谢尔顿美剧有提到rueful,但是我找了也找不到哪一季哪一集
Woolf
2024 年1 月 4 日 03:55
4
这种美剧里面的口语,和美国人日常讲话接近么?现在国产剧的口语,已经严重偏离国人的日常口语,外国人拿中文剧学口语,只能学一口机械普通话
台词检索应该有不少网站吧,检索视频,画面,翻译这些都好像见过,mdx这种形式感觉不太适合你的要求
encn
2024 年1 月 5 日 02:41
11
只是借了 mdx 的壳,本质上是浏览器+html+js本地检索剧本。
你说的网站我试过一些,大都检索字幕,而字幕文本是相当割裂的,无法构成完整对白。也不能定制化。
encn
2024 年1 月 5 日 02:57
12
存在检索剧本的网站,下面这个就不错。没完全符合我的需求。
2 个赞
filelocator这样的全文搜索软件不能满足要求么?
encn
2024 年1 月 5 日 04:20
14
我想用参数或程序控制两点:1、怎样搜索,2、返回显示什么结果。
用现成的软件很难实现。
这个 tvquot.es 的文本质量很高啊。搜索返回不相关的上下文也很苦恼,这个文本长度刚好。
encn
2024 年1 月 5 日 04:29
16
last_idol:
这个 tvquot.es 的文本质量很高啊
文本都是爱好者根据字幕整理的剧本。
用关键词 new boy 在该网站查不到一楼贴出的老友记片段。它的搜索方法可能有问题。
1 个赞
encn
2024 年1 月 9 日 15:40
18
简单清理了下 Friends 剧本,写了个 demo,感觉搜索还算流畅。
encn
2024 年1 月 10 日 00:49
19
encn:
使用 FlexSearch.js
FlexSearch v0.7.31 还不支持匹配文本高亮,v0.8 将支持。
add custom output formatter, e.g. for highlighting results
Let's discuss the new version. Also I have some important new features I would like to show you. Feature: Storage Interface including Postgres, SQLite, MongoDB, Clickhouse + Web SQL The whole expor...
纸牌屋.pdf.zip (17.3 MB)
纸牌屋1-5季台词,整理得挺不错的,不过好多年前的东西了,忘了从哪收集的。
1 个赞