博客
关于我
商品订单频繁项集数据流分析
阅读量:168 次
发布时间:2019-02-28

本文共 1253 字,大约阅读时间需要 4 分钟。

Redis中生成数据

在实际项目中,我们需要对商品之间的关系进行分析和存储。以下是基于Redis的数据生成过程:

数据生成

  • ID1 对应的商品对为:
    • (商品1, 2)
    • (商品2, 3)
    • (商品3, 4)
    • (商品4, 5)
  • ID2 对应的商品对为:
    • (商品2, 3)
    • (商品3, 3)
    • (商品4, 2)
    • (商品5, 5)
  • ID3 对应的商品对为:
    • (商品1, 2)
    • (商品2, 2)
    • (商品3, 4)
    • (商品5, 1)

数据存储

将上述商品对存储到Redis中的键 itemCounts 中:

  • (商品1, 2)
  • (商品2, 3)
  • (商品3, 3)
  • (商品4, 2)
  • (商品5, 5)
  • (商品1, 2)
  • (商品2, 2)
  • (商品3, 4)
  • (商品5, 1)

经过SplitBolt后

发射的数据为12条:

  • (ID1, 商品1, 2)
  • (ID1, 商品2, 3)
  • (ID1, 商品3, 4)
  • (ID1, 商品4, 5)
  • (ID2, 商品2, 3)
  • (ID2, 商品3, 3)
  • (ID2, 商品4, 2)
  • (ID2, 商品5, 5)
  • (ID3, 商品1, 5)
  • (ID3, 商品2, 2)
  • (ID3, 商品3, 4)
  • (ID3, 商品5, 1)

经过PairCountBolt后

Redis数据存储到键 itemCounts 中:

  • (商品1, 2) -> 2
  • (商品1, 3) -> 2
  • (商品1, 4) -> 1
  • (商品1, 5) -> 1
  • (商品2, 3) -> 3
  • (商品2, 4) -> 2
  • (商品3, 4) -> 2
  • (商品2, 5) -> 2
  • (商品3, 5) -> 2
  • (商品4, 5) -> 1

经过SupportComputeBolt后

对上述数据进行支持度计算:

  • (商品1, 2) -> 2/18
  • (商品1, 3) -> 2/18
  • (商品1, 4) -> 1/18
  • (商品1, 5) -> 1/18
  • (商品2, 3) -> 3/18
  • (商品2, 4) -> 2/18
  • (商品3, 4) -> 2/18
  • (商品2, 5) -> 2/18
  • (商品3, 5) -> 2/18
  • (商品4, 5) -> 1/18

经过ConfidenceComputeBolt后

对支持度进行置信度计算(以支持度为依据,除以对应的频率):

  • (商品1, 2) -> 2/18 ÷ 2
  • (商品1, 3) -> 2/18 ÷ 2
  • (商品1, 4) -> 1/18 ÷ 2
  • (商品1, 5) -> 1/18 ÷ 2
  • (商品2, 3) -> 3/18 ÷ 3
  • (商品2, 4) -> 2/18 ÷ 2
  • (商品3, 4) -> 2/18 ÷ 2
  • (商品2, 5) -> 2/18 ÷ 2
  • (商品3, 5) -> 2/18 ÷ 2
  • (商品4, 5) -> 1/18 ÷ 2

经过FilterBolt后

将支持度和置信度结果存储到Redis中的键 recommendedPairs 中:

  • (商品n, 商品m) -> (支持度, 置信度)

转载地址:http://biej.baihongyu.com/

你可能感兴趣的文章
npm错误 gyp错误 vs版本不对 msvs_version不兼容
查看>>
npm错误Error: Cannot find module ‘postcss-loader‘
查看>>
npm,yarn,cnpm 的区别
查看>>
NPOI
查看>>
NPOI之Excel——合并单元格、设置样式、输入公式
查看>>
NPOI初级教程
查看>>
NPOI利用多任务模式分批写入多个Excel
查看>>
NPOI在Excel中插入图片
查看>>
NPOI将某个程序段耗时插入Excel
查看>>
NPOI格式设置
查看>>
NPOI设置单元格格式
查看>>
Npp删除选中行的Macro录制方式
查看>>
NR,NF,FNR
查看>>
nrf24l01+arduino
查看>>
nrf开发笔记一开发软件
查看>>
nrm —— 快速切换 NPM 源 (附带测速功能)
查看>>
nrm报错 [ERR_INVALID_ARG_TYPE]
查看>>
NS3 IP首部校验和
查看>>
NSDateFormatter的替代方法
查看>>
NSError 的使用方法
查看>>