1. TF-IDF1.1. 什么是TF-IDF在一份给定的文件里,词频 (term frequency, TF) 指的是某一个给定的词语在该文件中出现的次数。这个数字通常会被归一化(分子一般小于分母 区别于IDF),以防止它偏向长的文件。(同一个词语在长文件里可能会比短文件有更高的词频,而不管该词语 ...
Neo4j Cypher语句
1. 查询操作1.1. 根据Label查询节点// 查询所有label为Movie的节点MATCH (n: movie)RETURN n 1.2. 根据属性查询节点// 指定nameMATCH (n: Movie { name: "幻海奇情", tag: "喜 ...
ElasticSearch 同义词
参考: https://www.cnblogs.com/spectrelb/p/8038980.html https://www.jianshu.com/p/3e63f6739631 官方:https://www.elastic.co/guide/en/elasticsearch/referenc ...
ElasticSearch 基础
1. settings与概mappings settings是修改分片和副本数的 mappings是修改字段和类型的 2. query与filterfilter,仅仅只是按照搜索条件过滤出需要的数据而已,不计算任何相关度分数,对相关度没有任何影响query,会去计算每个document相对于搜索条 ...
ElasticSearch 分词
1. 什么是分词器切分词语,normalization(提升recall召回率) 给你一段句子,然后将这段句子拆分成一个一个的单个的单词,同时对每个单词进行normalization(时态转换,单复数转换),分词器recall,召回率:搜索的时候,增加能够搜索到的结果的数量 character fi ...
ElasticSearch JavaAPI
Java Client Version: 6.2.4 参考资料: Elasticsearch Java High Level REST Client https://segmentfault.com/a/1190000016830796?utm_source=tag-newest 1. 建立关闭 ...
SpringBoot 整合ElasticSearch
Spring Data Elasticsearch官方文档:https://docs.spring.io/spring-data/elasticsearch/docs/current/reference/html/ Spring Data ElasticSearch Github:https://g ...