baihongyu.com
博客
关于我
商品订单频繁项集数据流分析
阅读量:
168 次
发布时间:
2019-02-28
本文共 1215 字,大约阅读时间需要 4 分钟。
一 Redis中生成数据
ID1 [(商品1,2),(商品2,3),(商品3,4),(商品4,5)]
ID2 [(商品2,3),(商品3,3),(商品4,2),(商品5,5)]
ID3 [(商品1,2),(商品2,2),(商品3,4),(商品5,1)]
二 经过Spolt后
1 发射的数据为12条
(ID1,商品1,2)
(ID1,商品2,3)
(ID1,商品3,4)
(ID1,商品4,5)
(ID2,商品2,3)
(ID2,商品3,3)
(ID2,商品4,2)
(ID2,商品5,5)
(ID3,商品1,5)
(ID3,商品2,2)
(ID3,商品3,4)
(ID3,商品5,1)
2 Redis数据存储到键itemCounts
(商品1,2)
(商品2,3)
(商品3,3)
(商品4,2)
(商品5,2)
三 经过SplitBolt,发射18条数据
(商品1,商品2)
(商品1,商品3)
(商品1,商品4)
(商品2,商品3)
(商品2,商品4)
(商品3,商品4)
(商品2,商品3)
(商品2,商品4)
(商品2,商品5)
(商品3,商品4)
(商品3,商品5)
(商品4,商品5)
(商品1,商品2)
(商品1,商品3)
(商品1,商品5)
(商品2,商品3)
(商品2,商品5)
(商品3,商品5)
四 经过PairCountBolt
(商品1,商品2)->2
(商品1,商品3)->2
(商品1,商品4)->1
(商品1,商品5)->1
(商品2,商品3)->3
(商品2,商品4)->2
(商品3,商品4)->2
(商品2,商品5)->2
(商品3,商品5)->2
(商品4,商品5)->1
五 经过PairCountBolt
商品对总数:18
六 经过SupportComputeBolt
(商品1,商品2)->2/18
(商品1,商品3)->2/18
(商品1,商品4)->1/18
(商品1,商品5)->1/18
(商品2,商品3)->3/18
(商品2,商品4)->2/18
(商品3,商品4)->2/18
(商品2,商品5)->2/18
(商品3,商品5)->2/18
(商品4,商品5)->1/18
七 经过ConfidenceComputeBolt
(商品1,商品2)->2/18 再除以2
(商品1,商品3)->2/18 再除以2
(商品1,商品4)->1/18 再除以2
(商品1,商品5)->1/18 再除以2
(商品2,商品3)->3/18 再除以3
(商品2,商品4)->2/18 再除以2
(商品3,商品4)->2/18 再除以2
(商品2,商品5)->2/18 再除以2
(商品3,商品5)->2/18 再除以2
(商品4,商品5)->1/18 再除以2
八 经过FilterBolt
Redis中存入键recommendedPairs
(商品n,商品m)->(支持度,置信度)
转载地址:http://biej.baihongyu.com/
你可能感兴趣的文章
MySQL 备份 Xtrabackup
查看>>
mYSQL 外键约束
查看>>
mysql 多个表关联查询查询时间长的问题
查看>>
mySQL 多个表求多个count
查看>>
mysql 多字段删除重复数据,保留最小id数据
查看>>
MySQL 多表联合查询:UNION 和 JOIN 分析
查看>>
MySQL 大数据量快速插入方法和语句优化
查看>>
mysql 如何给SQL添加索引
查看>>
mysql 字段区分大小写
查看>>
mysql 字段合并问题(group_concat)
查看>>
mysql 字段类型类型
查看>>
MySQL 字符串截取函数,字段截取,字符串截取
查看>>
MySQL 存储引擎
查看>>
mysql 存储过程 注入_mysql 视图 事务 存储过程 SQL注入
查看>>
MySQL 存储过程参数:in、out、inout
查看>>
mysql 存储过程每隔一段时间执行一次
查看>>
mysql 存在update不存在insert
查看>>
Mysql 学习总结(86)—— Mysql 的 JSON 数据类型正确使用姿势
查看>>
Mysql 学习总结(87)—— Mysql 执行计划(Explain)再总结
查看>>
Mysql 学习总结(88)—— Mysql 官方为什么不推荐用雪花 id 和 uuid 做 MySQL 主键
查看>>