- 博客(3)
- 收藏
- 关注
原创 ES全文搜索优势
问题:ES与建立了索引的数据库的区别?数据库一个字段的值是没有分词的,因此一个字段不能有多个索引,即索引多值,如content字段值为“明天放假了”在ES中通过分词,“明天”和“放假”都有索引指向该文档,即多值索引。而在数据库中“明天放假了”是一个整体,建立索引也只有“明天放假了”会有索引指向该文档(表)因此在搜索时,搜索“明天”“放假”“明天放假了”都能找到该文档而在数据库中只有搜索“明天放假了...
2018-04-28 17:21:47
4136
1
原创 ES:倒排索引与全文搜索
倒排索引(Inverted index):通常的索引是通过文档找关键词,即通过文档id找到文档,再从中找关键词。而倒排索引则是通过关键词找到其所在的文档。即:传统索引:文档 ---> 单词倒排索引:单词 ---> 文档单词存在内存的“词典”中,相当于索引(传统意义上的索引,不是ES中的index)文件,获得单词后,通过字典树之类的方式确定存储该单词的倒排索引存储位置,其中存储了单词信息...
2018-04-28 15:43:14
3655
原创 中英文对齐
首先设置一个长度上限,如60,当带中文字符串长度不足60时,在后面补上英文空格。计算带带中文字符串的长度,然后减去带中文字符串的长度*2(中文占两个字符)得到需要补空格的个数width,之后遍历字符串,统计非中文字符个数eCount。之后width加上eCount(非中文字符占一格,把多减去的加上)。最后在字符串后边补上width个空格,就可以得到等长的字符串。companyList.add(co...
2018-04-18 11:30:59
619
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人