利用表结构存储海量对象-属性-值关系,兼顾搜索效率

问题

如何构建表结构以存储海量的对象-属性-值三元组,同时兼顾有效的搜索性能,尤其是当不同对象拥有的属性可能有所不同且数据频繁更新时?

解决方案

使用下述表结构:

  • 主表:rel_id int, obj_id int, prop_id int, val_type int
  • 对象描述表:obj_id int, obj_desc string
  • 属性描述表:prop_id int, prop_desc string
  • 值表:rel_id int, val_[type] [value type]

讨论

  • 主表:记录三元组关系,其中:

    • rel_id:关系唯一标识符
    • obj_id:对象标识符
    • prop_id:属性标识符
    • val_type:值类型(整数、布尔值、日期等)
  • 对象描述表:描述对象
  • 属性描述表:描述属性

对于每次三元组,它将被存储在主表中,并根据值类型存储在相应的值表中。

此设计允许具有不同值的自定义属性,并使搜索效率得到优化,因为它允许通过索引对象、属性或值查找特定的三元组。

与维基数据的比较

维基数据将属性存储在 JSON 意味着每个属性都存储在单独的列中,这可能会导致搜索效率低下。而该表结构使用关系数据库,其中属性存储在单独的表中,通过主键相互关联,从而提高了搜索性能。

其他考虑

  • 如果大多数字段需要模糊查询,可以使用 Elasticsearch 等搜索引擎来完善整体功能。
  • 如果数据高度可定制,可以使用 Mongo 数据库,使用 JSON 实现。

以上就是如何构建表结构以存储海量对象-属性-值关系并提高搜索效率?的详细内容,更多请关注慧达安全导航其它相关文章!

点赞(0)

评论列表 共有 0 条评论

暂无评论
立即
投稿
发表
评论
返回
顶部