MongoDB进行
NoSQL之旅,我想触摸一个经常出现的特定用例:存储分层文档关系。
MongoDB
是很棒的文档数据存储,但是如果文档具有父子关系怎么办?
我们可以有效地存储和查询此类文档层次结构吗?
答案是肯定的,我们可以。
MongoDB
对如何
在MongoDB中
存储
树
提出了一些建议。
那里描述的并且广泛使用的一种解决方案是使用物化路径。
让我通过提供非常简单的示例来解释其工作原理。 如前几篇文章所述,我们将使用最近发布的
Spring Data MongoDB
项目的1.0版来构建
Spring
应用程序。 我们的POM文件包含非常基本的依赖性,仅此而已。
4.0.0
mongodb
com.example.spring
0.0.1-SNAPSHOT
jar
UTF-8
3.0.7.RELEASE
org.springframework.data
spring-data-mongodb
1.0.0.RELEASE
org.springframework
spring-beans
org.springframework
spring-expression
cglib
cglib-nodep
2.2
log4j
log4j
1.2.16
org.mongodb
mongo-java-driver
2.7.2
org.springframework
spring-core
${spring.version}
org.springframework
spring-context
${spring.version}
org.springframework
spring-context-support
${spring.version}
org.apache.maven.plugins
maven-compiler-plugin
2.3.2
1.6
1.6
为了正确配置
Spring
上下文,我将使用利用Java类的配置方法。 我越来越提倡使用这种样式,因为它提供了强大的类型化配置,并且大多数错误都可以在编译时发现,而无需再检查XML文件。 这里看起来像:
package com.example.mongodb.hierarchical;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.springframework.data.mongodb.core.MongoFactoryBean;
import org.springframework.data.mongodb.core.MongoTemplate;
import org.springframework.data.mongodb.core.SimpleMongoDbFactory;
@Configuration
public class AppConfig {
@Bean
public MongoFactoryBean mongo() {
final MongoFactoryBean factory = new MongoFactoryBean();
factory.setHost( "localhost" );
return factory;
}
@Bean
public SimpleMongoDbFactory mongoDbFactory() throws Exception{
return new SimpleMongoDbFactory( mongo().getObject(), "hierarchical" );
}
@Bean
public MongoTemplate mongoTemplate() throws Exception {
return new MongoTemplate( mongoDbFactory() );
}
@Bean
public IDocumentHierarchyService documentHierarchyService() throws Exception {
return new DocumentHierarchyService( mongoTemplate() );
}
}
很好,很清楚。 谢谢,
春天的
家伙! 现在,所有样板文件已准备就绪。 让我们转到有趣的部分:文档。 我们的数据库将包含“文档”集合,其中存储了SimpleDocument类型的文档。 我们使用针对SimpleDocument POJO的
Spring Data MongoDB
批注对此进行描述。
package com.example.mongodb.hierarchical;
import java.util.Collection;
import java.util.HashSet;
import org.springframework.data.annotation.Id;
import org.springframework.data.annotation.Transient;
import org.springframework.data.mongodb.core.mapping.Document;
import org.springframework.data.mongodb.core.mapping.Field;
@Document( collection = "documents" )
public class SimpleDocument {
public static final String PATH_SEPARATOR = ".";
@Id private String id;
@Field private String name;
@Field private String path;
// We won't store this collection as part of document but will build it on demand
@Transient private Collection< SimpleDocument > documents = new HashSet< SimpleDocument >();
public SimpleDocument() {
}
public SimpleDocument( final String id, final String name ) {
this.id = id;
this.name = name;
this.path = id;
}
public SimpleDocument( final String id, final String name, final SimpleDocument parent ) {
this( id, name );
this.path = parent.getPath() + PATH_SEPARATOR + id;
}
public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getPath() {
return path;
}
public void setPath(String path) {
this.path = path;
}
public Collection< SimpleDocument > getDocuments() {
return documents;
}
}
让我在这里解释几件事。 首先,魔术属性
路径
:这是构造和查询层次结构的关键。 路径包含所有文档父级的标识符,通常以某种分隔符(在我们的情况下为)分隔
。
(点)
。 以这种方式存储文档层次结构关系可以快速构建层次结构,进行搜索和导航。 其次,注意临时
文档
集合:此非持久集合是由持久提供程序构造的,并且包含所有后代文档(以防万一,还包含自己的后代)。 让我们通过查找
find
方法实现来实际观察它:
package com.example.mongodb.hierarchical;
import java.util.Arrays;
import java.util.Collection;
import java.util.HashMap;
import java.util.Map;
import org.springframework.data.mongodb.core.MongoOperations;
import org.springframework.data.mongodb.core.query.Criteria;
import org.springframework.data.mongodb.core.query.Query;
public class DocumentHierarchyService {
private MongoOperations template;
public DocumentHierarchyService( final MongoOperations template ) {
this.template = template;
}
@Override
public SimpleDocument find( final String id ) {
final SimpleDocument document = template.findOne(
Query.query( new Criteria( "id" ).is( id ) ),
SimpleDocument.class
);
if( document == null ) {
return document;
}
return build(
document,
template.find(
Query.query( new Criteria( "path" ).regex( "^" + id + "[.]" ) ),
SimpleDocument.class
)
);
}
private SimpleDocument build( final SimpleDocument root, final Collection< SimpleDocument > documents ) {
final Map< String, SimpleDocument > map = new HashMap< String, SimpleDocument >();
for( final SimpleDocument document: documents ) {
map.put( document.getPath(), document );
}
for( final SimpleDocument document: documents ) {
map.put( document.getPath(), document );
final String path = document
.getPath()
.substring( 0, document.getPath().lastIndexOf( SimpleDocument.PATH_SEPARATOR ) );
if( path.equals( root.getPath() ) ) {
root.getDocuments().add( document );
} else {
final SimpleDocument parent = map.get( path );
if( parent != null ) {
parent.getDocuments().add( document );
}
}
}
return root;
}
}
如您所见,要获得具有整个层次结构的单个文档,我们只需要运行两个查询(但更优化的算法可以将其缩减为一个查询)。 这是一个示例层次结构,以及从
MongoDB
读取根文档的结果
template.dropCollection( SimpleDocument.class );
final SimpleDocument parent = new SimpleDocument( "1", "Parent 1" );
final SimpleDocument child1 = new SimpleDocument( "2", "Child 1.1", parent );
final SimpleDocument child11 = new SimpleDocument( "3", "Child 1.1.1", child1 );
final SimpleDocument child12 = new SimpleDocument( "4", "Child 1.1.2", child1 );
final SimpleDocument child121 = new SimpleDocument( "5", "Child 1.1.2.1", child12 );
final SimpleDocument child13 = new SimpleDocument( "6", "Child 1.1.3", child1 );
final SimpleDocument child2 = new SimpleDocument( "7", "Child 1.2", parent );
template.insertAll( Arrays.asList( parent, child1, child11, child12, child121, child13, child2 ) );
...
final ApplicationContext context = new AnnotationConfigApplicationContext( AppConfig.class );
final IDocumentHierarchyService service = context.getBean( IDocumentHierarchyService.class );
final SimpleDocument document = service.find( "1" );
// Printing document show following hierarchy:
//
// Parent 1
// |-- Child 1.1
// |-- Child 1.1.1
// |-- Child 1.1.3
// |-- Child 1.1.2
// |-- Child 1.1.2.1
// |-- Child 1.2
而已。 简单一个强大的概念。 当然,在
路径
属性上添加索引将大大加快查询速度。 有很多改进和优化,但是基本思想现在应该很清楚。
参考:
Andriy Redko {devmind}
博客上的
JCG合作伙伴
Andrey Redko
在MongoDB中存储分层数据
。
翻译自:
https://www.javacodegeeks.com/2012/01/storing-hierarchical-data-in-mongodb.html