资讯专栏INFORMATION COLUMN

Mongo索引学习笔记

tianhang / 2411人阅读

摘要:索引使用场景优加快查询速度劣增删改会产生额外的开销占用空间返回集合中一半以上的数据,全表扫描的效率高索引基础基础操作查看索引创建索引已有大量数据时可后台执行不阻塞删除索引查看索引大小属性索引顺序为正序,为逆序在复合索引中需注意顺序索引属

索引使用场景

优:加快查询速度

劣:增删改会产生额外的开销、占用空间

tips: 返回集合中一半以上的数据,全表扫描的效率高

索引基础 基础操作

查看索引:db.test.getIndexes()

创建索引:db.test.ensureIndex({"username":1},{"background":true,"name":"index_test_name"}) //已有大量数据时可后台执行不阻塞

删除索引: db.test.dropIndex({"username":1})

查看索引大小: db.test.totalIndexSize()

属性

索引顺序:

1为正序,-1为逆序

在复合索引中需注意顺序(id:1, age:-1)

索引属性:

唯一性

db.test.ensureIndex({x:1,y:1},{unique:true})

稀疏性

db.test.ensureIndexx({},{sparse:true/false})
不稀疏(默认):
1. 可插入不存在索引字段的数据,null; 
2. 可筛选不存在字段: db.test.find({m:{$exist:ture}})
稀疏:
优化分析方法

explain

获知系统如何处理请求

cursor  返回游标类型(BasicCursor或BtreeCursor)
nscanned  被扫描的文档数量
n 返回的文档数
millis  耗时(毫秒)
indexBounds  所使用的索引

hint

强制使用某个索引

db.test.find({"age":20}).hint({"name":1,"age":1}) // .hint(name_1_age_1)

profile

设置日志级别,记录慢查询

Tips

查询条件顺序自动调整

能为前缀式的正则表达式命中索引(/^z/)

对需要大量sort的键建立索引,避免全部数据加载到内存

$ne、$nin 不会使用索引

索引种类

_id索引

默认生成唯一字段

单键索引

值为一个单一的值

db.test.ensureIndex({x:1})

多键索引

值具有多个记录,如数组、内嵌文档

db.test.insert({x:[1,2,3,4]})

每一个索引字段最多包含一个数组

Y: {_id:1, a:[1,2], b:1, category:"A array"} 与 {_id:2, a:1, b:[1,2], category:"B array"}
N: {_id:3, a:[1,2], b:[1,2], category:"AB both array"}

查询

//数组查询
数组中包含: db.fruitshop.find({"fruits":"apple"})
包含多个: db.fruitshop.find({"fruits":{"$all":["apple", "banana"]}})
精确匹配: db.fruitshop.find({"fruits":["apple","orange","pear"]}) //顺序与数量一致
特定位置元素查询: db.fruitshop.find({"fruits.1":"orange"})
查询数组长度: db.fruitshop.find({"fruits":{"$size":3}}) //size不能和其他操作符连用,如"$gt"等
返回固定长度: db.fruitshop.find({"fruits":{"$slice":2}}) //前2个
              db.fruitshop.find({"fruits":{"$slice":-1}}) //后1个
              db.fruitshop.find({"fruits":{"$slice":[3,6]}}) //第4~7个,无数据则返回[]

//内嵌文档
完全匹配: db.staff.find({"name":{"first":"joe","middle":"bush"}}) //顺序与数量一致
键值对查询: db.staff.find({"name.first":"joe","name.middle":"bush"}) //点表示法,在插入时键名不能包含点(约束)
多层内嵌: elemMatch  db.blogs.find({"comment":{"$elemMatch":{"author":"joe", "score":{"$gte":3}}}}) //内嵌文档中匹配author和score条件
          where  db.fruitshop.find({"$where":function(){}}) //性能低,每个文档转换成一个javascript对象放入函数执行

复合索引

多个条件,从左到右执行

{a:1,b:1,c:1} => {a:1},{a:1,b:1},{a:1,b:1,c:1}

db.test.ensureIndex({x:1,y:1})

过期索引

一段时间后过期,删除相应数据(用户的登录信息、存储的日志)

db.test.ensureIndex({time:1},{expireAfterSeconds:30})

限制

字段类型必须是ISODate或者ISODate数组(数组中最小的时间)
不能是复合索引(不能指定两个过期时间)
删除时间不精确(后台进程60s跑一次)

全文索引

字符串或者字符串数组可搜索

//建立索引
db.test.ensureIndex({title:"text"})
db.test.ensureIndex({key1:"text",key2:"text"}) //对多个字段创建全文索引
db.test.ensureIndex({$**:"text"}) //对所有字段建全文索引

//查找
不需要指定字段名称: db.test.find({"$text":{"$search":"coffee"}}) //每个数据集合只允许创建一个全文索引(可针对一个、多个、全部字段)
查找多个关键词(空格代表 或 操作): db.test.find({"$text":{"$search":"aa bb cc"}})
指定不包含词(-代表 非 操作): db.test.find({"$text":{"$search":"aa bb -cc"}})
与关系操作: db.test.find({"$text":{"$search":""aa" "bb" "cc""}})
相似度查询: db.test.find({"$text":{"$search":"aa bb"}},{"score:{"$meta":"textScore"}"}) //score字段得分越高,相关度越高
            db.test.find({"$text":{"$search":"aa bb"}},{"score":{"$meta":"textScore"}}).sort({"score":{"$meta":"textScore"}}) //score相关度排序
            
//限制
每次查询只能指定一个$text
有了$text则hint(强制指定索引)不起作用
中文支持不好(企业版可支持)

地理位置索引

将点的位置存储,可以按位置查找其他点

2D索引
用于存储和查找平面上的点

db.test.ensureIndex({w:"2d"})

//使用经纬度表示
取值范围 经度[-180,180] 纬度[-90,90]
db.test.insert({w:[180,90]})

//查询
使用$near查询距离某个点最近的点(默认返回100个)
    db.test.find({"$near":[x,y]})
    db.test.find({w:{"$near":[x,y],"$maxDistance":"z"}}) //限制返回的最远距离
 
使用$geoWithin查询某个形状内的点
    矩形($box:[[x1,y1],[x2,y2]]) db.test.find({w:{"$geoWithin:{"$box":[[0,0],[3,3]]}}"}})
    圆形($center:[[x,y],r])  db.test.find({w:{"$geoWithin":{"$center":[0,0],5}}})
    多边形($polygon:[[x1,y1],[x2,y2],..)  db.test.find({w:{"$geoWithin":{"$polygon":[[0,0],[0,1],[2,5],[6,1]]}}})
    
使用$geoNear查询,返回最大距离和平均距离等数据

相关扩展:
《地理位置索引的实现原理》

2Dsphere索引
用于存储和查找球面上的点

db.test.ensureIndex({key:"2dsphere"})

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/19317.html

相关文章

  • Mongo索引学习笔记

    摘要:索引使用场景优加快查询速度劣增删改会产生额外的开销占用空间返回集合中一半以上的数据,全表扫描的效率高索引基础基础操作查看索引创建索引已有大量数据时可后台执行不阻塞删除索引查看索引大小属性索引顺序为正序,为逆序在复合索引中需注意顺序索引属 索引使用场景 优:加快查询速度 劣:增删改会产生额外的开销、占用空间 tips: 返回集合中一半以上的数据,全表扫描的效率高 索引基础 基础操作 查看...

    nihao 评论0 收藏0
  • mongodb学习笔记

    摘要:我们常说的分表分库分区等概念都属于分片的实际体现。传统分片做法是手工分表分库。自动分片技术是根据指定的片键自动拆分数据并维护数据请求路由的过程。 1.mongodb特性 1)mongo是一个面向文档的数据库,它集合了nosql和sql数据库两方面的特性。 2)所有实体都是在首次使用时创建。 3)没有严格的事务特性,但是它保证任何一次数据变更都是原子性的。 4)也没有固定的数据模型 5)...

    王晗 评论0 收藏0
  • mongoDB 学习笔记纯干货(mongoose、增删改查、聚合、索引、连接、备份与恢复、监控等等)

    摘要:集合名命名规范集合名不能是空字符串。集合名不能含有字符空字符,这个字符表示集合名的结尾。集合名不能以开头,这是为系统集合保留的前缀。有些驱动程序的确支持在集合名里面包含,这是因为某些系统生成的集合中包含该字符。 原始文章链接 - 我的博客:http://www.lovebxm.com/2017/0... MongoDB - 简介 官网:https://www.mongodb.com/ ...

    Java3y 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<