试图与令人敬畏的 mongolite 库进行正则表达式匹配,但我仍然不确定我做错了什么,对我在这里错过的东西感到非常疯狂。

library(mongolite)
m <- mongo(url = "mongodb://192.168.1.5:27017", db = "products", collection =    "sku")

m$count()
#gives 54524

a1 <- m$find('{"item"  : { "$regex" : "/.*A*./i" }}')
returns Imported 0 records. Simplifying into dataframe...

#but when you do
a1 <- m$find('{"item"  : "ABC"}')
#returns 8 records
a1 <- m$find('{"item"  : "AAC"}')
#returns 5 records
a1 <- m$find('{"item"  : "AAAC"}')
#returns 18 records

很快。所以我不确定我在 mongodb 中调用正则表达式运算符的方式有什么问题。有什么线索。?谢谢

最佳答案

在 mongo shell 中,您将使用不带引号的 / ... /。但是,在 mongolite 中你需要引号,否则它是 无效的 JSON

因此,您需要使用 ... { "$regex" : ".*A*.", "$options" : "i"}...
考虑这个例子

library(mongolite)

m <- mongo(db = "test", collection = "test", url = "mongodb://localhost")

## create and insert some dummy data
set.seed(2016)
df <- data.frame(id = seq(1:100),
                val = sample(letters, size = 100, replace = T))

m$insert(df)

## valid regex query in mongolite
m$find('{ "val" : { "$regex" : "^a", "$options" : "i" }  }')
# Imported 5 records. Simplifying into dataframe...
#     id val
# 1  26   a
# 2  53   a
# 3  61   a
# 4  76   a
# 5 100   a

## these queries don't work.
m$find('{ "val" : { "$regex" : "/^a/", "$options" : "i" }  }')
# Imported 0 records. Simplifying into dataframe...
# data frame with 0 columns and 0 row

m$find('{ "val" : { "$regex" : /^a/, "$options" : "i" }  }')
# Error: Invalid JSON object: { "val" : { "$regex" : /^a/, "$options" : "i" }  }

而在 mongo shell(我使用 robomongo)中,您 可以 使用
db.test.find({ "val" : { "$regex" : /^a/ }  })
## or
db.test.find({ "val" : { "$regex" : "^a" }  })

现在,如果您希望更快地将数据导入 R ,并且可以将结果强制转换为 data.table 而不会丢失数据,您可以使用我编写的扩展 mongolite 的包,该包使用 data.table::rbindlist 转换结果到 data.table 。由于假设您的数据处于“表格”结构并避免了将 JSON 简化为 data.frame 的 mongolite 中的递归调用,因此速度会提高。有关更多详细信息,请参阅 my github page
# library(devtools)
# install_github("SymbolixAU/mongolitedt")
library(mongolitedt)
bind_mongolitedt(m)

m$finddt('{ "val" : { "$regex" : "^A", "$options" : "i" }  }')
## returns a data.table
#  Imported 5 records.
#     id val
# 1:  26   a
# 2:  53   a
# 3:  61   a
# 4:  76   a
# 5: 100   a

关于正则表达式与 R 中的 mongolite,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/37287456/

10-10 23:53