51工具盒子

依楼听风雨
笑看云卷云舒,淡观潮起潮落

Elasticsearch简单应用

关于Elasticsearch {#heading-1}

Elaticsearch是专门用于解决搜索问题的NoSQL的文档数据库。

无论使用哪种操作系统,只需要下载elasticsearch的压缩包并解压即可使用,需要注意,elasticsearch文件夹的各层级的父级文件夹的名称中不允许包含非ASCII码字符和空格!例如放在D盘根目录下:

image-20230810103020943

执行bin目录下的elasticsearch即可启用Elasticsearch服务:

image-20230810103215524

启动成功后,效果大致如下:

image-20230810103356288

**注意:**在使用Elasticsearch的过程中,以上窗口不可关闭!

当启动成功后,你可以通过浏览器访问 http://localhost:9200,页面显示内容如下:

image-20230810103913516

elasticsearch提供了一套基于RESTful的访问,你可以使用任何一种可以提交REST请求的工具来访问elasticsearch及其中的数据,例如常见的测试工具PostMan等。

或者,你也可以在IntelliJ IDEA中,使用HTTP Request进行访问:

image-20230810104355105

在HTTP Request文件中编写需要提交的请求,然后,点击左侧的运行图标即可发起请求

image-20230810104550441

使用elasticsearch分词 {#heading-2}

Elasticsearch之所以能够高效处理搜索,是因为它会将你的数据进行"分词"处理,即将一段文本拆成若干个文本,在执行搜索时,会尝试检查是否匹配"拆"出来的某个文本。

http://localhost:9200/_analyze 提交请求即可分词,并且,请求中必须包含请求参数,参数名称固定为text,整个请求的格式大致如下:

image-20230810113711741

提示:在同一个.http文件中,可以编写多个请求,但是,后续的请求的代码必须使用 ### 和前序的请求分开,不能只使用1个 #

你也可以尝试对中文的句子进行分词,会发现,在默认情况下,Elasticsearch只能将中文中的每个字拆出来,并不能正确的处理各个词语!

示例代码:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 测试分词 -- 中文
GET http://localhost:9200/_analyze
Content-Type: application/json
`{
"text": "很高兴认识你!"
}`

可以在Elasticsearch中添加新的分词插件来解决以上问题,经典的中文分词插件就是ik分词器。

所有插件都应该放在Elasticsearch下的plugin文件夹下:

image-20230810114606110

你需要将下载得到的ik分词器的压缩包解压出来,将解压得到的文件夹放在plugins文件夹下,而ik分词器的文件夹名称就叫ik即可:

image-20230810114744905

**注意:**完成后,需要重启Elasticsearch(关了再打开)才可以应用新添加的分词器!

接下来,你就可以使用IK分词器对中文的句子进行分词!你需要在请求参数中通过analyzer属性来指定分词器,取值可以是IK分词器提供的ik_smartik_max_word,例如:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 测试分词 -- 中文 -- ik_smart
GET http://localhost:9200/_analyze
Content-Type: application/json

{
"analyzer": "ik_smart",
"text": "很高兴认识你!"
}


### 测试分词 -- 中文 -- ik_max_word



GET http://localhost:9200/_analyze
Content-Type: application/json

`{
"analyzer": "ik_max_word",
"text": "很高兴认识你!"
}`

使用IK分词器时,可以自造词!例如:

image-20230810140842583

Elasticsearch文档数据库的相关概念 {#heading-3}

索引(index / indices)

  • 相当于MySQL中的Database

类型(type / types)

  • 相当于MySQL中的Table,可以自行创建"类型",或者,如果不关心"类型",使用 _doc 表示类型名

  • ES本身并不注重"类型"的概念,甚至在较高版本(8.x或以上)基本已废弃此概念

文档(document / documents)

  • 相当于MySQL中各数据表中一行行的数据

  • 在ES中每个数据都是由JSON格式组织的

字段(field / fields)

  • 相当于MySQL中的Column

基于RESTful访问Elasticsearch {#heading-4}

操作汇总 {#heading-5}

添加文档 {#heading-6}

添加文档(使用ES随机生成的ID值)

请求格式:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

POST http://localhost:9200/{索引名}/{类型名}

提示:添加文档时,如果索引不存在,会自动创建索引,如果类型不存在,会自动创建类型!

请求示例:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 添加文档
POST http://localhost:9200/index_crud/_doc
Content-Type: application/json
`{
"id": 998,
"title": "2023新茶上市,赔本大甩卖",
"sort": 188
}`

添加文档(自行指定ID值)

请求格式:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

PUT http://localhost:9200/{索引名}/{类型名}/{文档ID}

请求示例:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 添加文档(自行指定ID值)
PUT http://localhost:9200/index_crud/_doc/Tea9527
Content-Type: application/json
`{
"id": 999,
"title": "2023老茶上市,卖得也相当不错",
"sort": 199
}`

删除 {#heading-7}

根据ID删除文档

请求格式:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

DELETE http://localhost:9200/{索引名}/{类型名}/{文档ID}

请求示例:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 根据ID删除文档
DELETE http://localhost:9200/index_crud/_doc/Tea9527

提示:如果尝试删除的文档不存在,将响应404错误!

删除索引

请求格式:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

DELETE http://localhost:9200/{索引名}

请求示例:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 删除索引
DELETE http://localhost:9200/index_crud

提示:如果尝试删除的索引不存在,将响应404错误!

修改文档 {#heading-8}

修改文档(更新整篇文档)

请求格式:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

PUT http://localhost:9200/{索引名}/{类型名}/{文档ID}

请求示例:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 修改文档(更新整篇文档)
PUT http://localhost:9200/index_crud/_doc/Tea9527
Content-Type: application/json
`{
"id": 999,
"title": "2023老茶上市,卖得也相当不错",
"sort": 199,
"description": "这个老茶味道很好,强烈推荐!"
}`

注意:以上做法将使用请求参数替换原有的整篇文档!

修改文档(局部修改)

请求格式:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

POST http://localhost:9200/{索引名}/{类型名}/{文档ID}/_update

请求参数:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

{
	"doc": {
        需要更新的数据的参数
    }
}

请求示例:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 修改文档(局部修改)
POST http://localhost:9200/index_crud/_doc/Tea9527/_update
Content-Type: application/json
`{
"doc": {
"sort": 189,
"description": "老茶和新茶味道还是挺不一样,要不,买个试试?"
}
}`

注意:如果请求参数中包含新的属性(原文档中没有的属性),也会更新成功,且在文档中新增新的属性!

查看文档 {#heading-9}

查看某个索引中的所有文档

请求格式

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

GET http://localhost:9200/{索引名}/_search

请求示例:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 查看某个索引中的所有文档
GET http://localhost:9200/index_crud/_search

根据ID访问文档

请求格式

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

GET http://localhost:9200/{索引名}/{类型名}/{文档ID}

请求示例:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 根据ID访问文档
GET http://localhost:9200/index_crud/_doc/yjEl3okBucTgSd_ILGK2

Elasticsearch中的数据类型 {#heading-10}

在Elasticsearch中,各字段的值也是有数据类型的,大致为:

  • 字符串类型:textkeyword

    • text类型在被处理时,默认会被分词

      • 默认

    • keyword类型在被处理时,默认不会被分词

  • 数值类型:byteshortintegerlongfloatdouble

  • 布尔类型:boolean

  • 日期类型:date

例如,准备一些测试数据:

| ID(id) | 标题(title) | 简介(description) | 排序序号(sort) | 售价(price) | |--------|-----------|-----------------|------------|-----------| | 1 | 散装龙井 | 好喝又实惠 | 160 | 300 | | 2 | 大红袍大礼包 | 性价比之王 | 190 | 688 | | 3 | 龙井礼盒 | 送礼必备 | 130 | 888 | | 4 | 精装陈年老普洱 | 收藏珍品 | 150 | 988 | | 5 | 精装铁观音大礼包 | 家中常备 | 160 | 700 |

在使用Elasticsearch时,应该先手动创建索引,并确定此索引中的文档有哪些字段,及字段的数据类型!

请求格式:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 自定义索引及其文档的属性和数据类型
PUT http://localhost:9200/{索引名}
Content-Type: application/json; charset=UTF-8
`{
"mappings": {
"properties": {
"{字段名1}": {
"type": "{字段类型1}",
"analyzer": "{分词器名称,仅用于text类型的字段}"
},
"{字段名2}": {
"type": "{字段类型2}"
},
... ...
"{字段名n}": {
"type": "{字段类型n}"
}
}
}
}`

请求示例:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 自定义索引及其文档的属性和数据类型
PUT http://localhost:9200/index_search
Content-Type: application/json; charset=UTF-8
`{
"mappings": {
"properties": {
"id": {
"type": "long"
},
"title": {
"type": "text",
"analyzer": "ik_max_word"
},
"description": {
"type": "keyword"
},
"sort": {
"type": "long"
},
"price": {
"type": "long"
}
}
}
}`

插入测试数据示例:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 添加文档--测试数据1
PUT http://localhost:9200/index_search/_doc/1
Content-Type: application/json

{
"id": 1,
"title": "散装龙井",
"description": "好喝又实惠",
"sort": 160,
"price": 300
}


### 添加文档--测试数据2



PUT http://localhost:9200/index_search/_doc/2
Content-Type: application/json


{
"id": 2,
"title": "大红袍大礼包",
"description": "性价比之王",
"sort": 190,
"price": 688
}


### 添加文档--测试数据3



PUT http://localhost:9200/index_search/_doc/3
Content-Type: application/json


{
"id": 3,
"title": "龙井礼盒",
"description": "送礼必备",
"sort": 130,
"price": 888
}


### 添加文档--测试数据4



PUT http://localhost:9200/index_search/_doc/4
Content-Type: application/json


{
"id": 4,
"title": "精装陈年老普洱",
"description": "收藏珍品",
"sort": 150,
"price": 988
}


### 添加文档--测试数据5



PUT http://localhost:9200/index_search/_doc/5
Content-Type: application/json

`{
"id": 5,
"title": "精装铁观音大礼包",
"description": "家中常备",
"sort": 160,
"price": 700
}`

搜索 {#heading-11}

简单的搜索

请求格式:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

GET http://localhost:9200/{索引名}/_search?q={字段名:查询关键字}

请求示例:

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 根据关键字执行简单的搜索
GET http://localhost:9200/index_search/_search?q=title:龙井

高级搜索

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 高级搜索:自定义query,在query属性下配置match属性,在match属性下再配置搜索的字段名与关键字
GET http://localhost:9200/index_search/_search
Content-Type: application/json

{
"query": {
"match": {
"title": "龙井"
}
}
}


### 高级搜索:多条件搜索:自定义query,在query属性下配置bool属性,在bool属性下再配置must,must的值是数组,数组元素就是匹配规则,must下的多个规则必须同时匹配才能被搜索到



### 除了must以外,还可以是should,should只需要匹配其中任意1个条件即可



### 另外,还可以是must_not,即不允许是某种规则



### must \>\>\> AND



### should \>\>\> OR



### must_not \>\>\> !=



GET http://localhost:9200/index_search/_search
Content-Type: application/json


{
"query": {
"bool": {
"should": \[
{
"match": {
"title": "龙井"
}
},
{
"match": {
"description": "送礼必备"
}
}
\]
}
}
}


### 高级搜索:查询指定字段的数据,在query同级配置_source,此属性的值是数组,用于指定字段列表



GET http://localhost:9200/index_search/_search
Content-Type: application/json


{
"query": {
"match_all": {}
},
"_source": \[
"id",
"title",
"price"
\]
}


### 高级搜索:指定排序,在query同级配置sort属性,在sort属性中配置排序规则,默认根据字段值升序排列,也可以配置order属性来指定规则,取值为desc时为降序



GET http://localhost:9200/index_search/_search
Content-Type: application/json


{
"query": {
"match_all": {}
},
"sort": \[
{
"sort": {},
"id": {
"order": "desc"
}
}
\]
}


### 高级搜索:分页搜索,在query同级配置from和size属性



GET http://localhost:9200/index_search/_search
Content-Type: application/json

`{
"query": {
"match_all": {}
},
"sort": [
{
"id": {}
}
],
"from": 1,
"size": 3
}`

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

### 高级搜索:高亮显示,在query同级配置highlight属性进行配置,在highlight中配置fields属性,可以指定对应的字段
### 执行搜索后,匹配的结果中会出现同级的highlight数据,其中搜索的关键字默认会被<em>标签框住,后续在客户端拿到此结果后可以对<em>标签设计CSS样式
### 或者,在配置高亮搜索时,还可以在highlight标签下配置pre_tags和post_tags属性,以替换<em>和</em>标签
GET http://localhost:9200/index_search/_search
Content-Type: application/json
`{
"query": {
"match": {
"title": "精装"
}
},
"highlight": {
"fields": {
"title": {}
},
"pre_tags": "<font style='color: red;'>",
"post_tags": "</font>"
}
}`

基于Spring Boot的Elasticsearch编程 {#heading-12}

添加依赖 {#heading-13}

在Spring Boot中,实现Elasticsearch编程需要添加依赖:spring-boot-starter-data-elasticsearch

定义文档数据的Java类 {#heading-14}

注意:与ES中的文档对应的Java类,并不需要与实体类、用于Redis的相关类保持一致!

使用ES时的Java类可以完全自由设计,只需要包含显示在"搜索结果中的属性(最终显示在客户端界面中的属性)"及"执行搜索时需要匹配的属性"即可。

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

@Data
@Document(index="mall_goods")
public class GoodsSearchVO implements Serializable {
	private Long id;
    private String categoryName;
    private String title;
    private String brief;
    private String coverUrl;
    private BigDecimal salePrice;
    private String keywords;
    private Integer sort;
    private Integer isRecommend;
    private Integer salesCount;
    private Integer commentCount;
    private Integer positiveCommentCount;
    private LocalDateTime gmtCreate;
    private LocalDateTime gmtModified;
}

编写数据访问接口 {#heading-15}

在Spring Boot项目中添加了Elasticsearch编程的依赖项后,只需要自定义接口,继承自框架中的Repository接口即可表示自定义接口是用于访问数据的,Repository接口需要指定2个泛型,分别是你要操作的数据的类型,和此数据在ES中的ID的类型。

赞(0)
未经允许不得转载:工具盒子 » Elasticsearch简单应用