您好。
一家数据分析公司交给我的任务是创建架构并用图表解释它们。这项任务有两个问题。 问题 1 与选择正确的技术和使用 NoSQL 云数据库的数据分区策略有关。 此外,还要减少计算时间,以便整个计算负载可以在几个小时内完成。
关于问题 2。一家货运公司处理大量发票(每天 40000 张)。目前,所有人都可以看到与他们无关的发票。您将如何设计一个系统以经济高效的方式存储所有这些数据?您将如何设计授权系统以确保组织只能看到与其自身相关的发票。
我看到了您关于 Cassandra 中数据分区的博客。我认为您可以帮助我,因为您可能已经知道解决方案。
谢谢Prakash Saswadkar孟买, 手机:+91-981 941 5206
-- 从 Word 文档复制粘贴 --问题1
一家大型快餐连锁店希望您为该快餐连锁店的 2000 家餐厅生成预测。每家餐厅都有近 500 种商品在售。该快餐连锁店提供了过去 3 年的门店、商品、每日级别的数据。要求是提供下一年的预测。假设数据是静态的。数据科学家研究了这个问题,并找到了提供最佳预测的解决方案。数据科学家构建了一种算法,该算法获取商店级别的所有数据,并生成商店级别的预测输出。处理每家商店需要 15 分钟。
问题1) 鉴于输入数据是静态的。存储数据的正确技术是什么?什么是正确的分区策略?2) 每家商店需要 15 分钟,您将如何设计系统来更快地协调计算 - 以便整个计算可以在 < 5 小时内完成?
在您设计解决方案时,做出您的方式中的任何假设并说明它们,并且不要担心分析部分。假设分析部分是一个黑盒子。
问题 2
一家货运公司每天处理接近 40,000 张发票。法规要求需要存储 7 年的数据。卡车司机在送货点使用他的移动设备扫描发票。图像识别程序扫描发票并添加从图像中捕获的元信息。元信息将包括发货地和收货地以及其他信息。货运公司可以看到其所有发票,发货组织可以查看所有发货地与其匹配的发票,类似的规则适用于收货地。
问题您将如何设计一个系统以经济高效的方式存储所有这些数据。您将如何设计授权系统以确保组织只能根据上述规则查看发票。使该解决方案在全球范围内可用的设计考虑因素是什么? -- --
您好。
一家数据分析公司交给我的任务是创建架构并用图表解释它们。这项任务有两个问题。 问题 1 与选择正确的技术和使用 NoSQL 云数据库的数据分区策略有关。 此外,还要减少计算时间,以便整个计算负载可以在几个小时内完成。
关于问题 2。一家货运公司处理大量发票(每天 40000 张)。目前,所有人都可以看到与他们无关的发票。您将如何设计一个系统以经济高效的方式存储所有这些数据?您将如何设计授权系统以确保组织只能看到与其自身相关的发票。
我看到了您关于 Cassandra 中数据分区的博客。我认为您可以帮助我,因为您可能已经知道解决方案。
谢谢
Prakash Saswadkar
孟买, 手机:+91-981 941 5206
-- 从 Word 文档复制粘贴 --
问题1
一家大型快餐连锁店希望您为该快餐连锁店的 2000 家餐厅生成预测。每家餐厅都有近 500 种商品在售。
该快餐连锁店提供了过去 3 年的门店、商品、每日级别的数据。要求是提供下一年的预测。
假设数据是静态的。数据科学家研究了这个问题,并找到了提供最佳预测的解决方案。
数据科学家构建了一种算法,该算法获取商店级别的所有数据,并生成商店级别的预测输出。
处理每家商店需要 15 分钟。
问题
1) 鉴于输入数据是静态的。存储数据的正确技术是什么?什么是正确的分区策略?
2) 每家商店需要 15 分钟,您将如何设计系统来更快地协调计算 - 以便整个计算可以在 < 5 小时内完成?
在您设计解决方案时,做出您的方式中的任何假设并说明它们,并且不要担心分析部分。假设分析
部分是一个黑盒子。
问题 2
一家货运公司每天处理接近 40,000 张发票。法规要求需要存储 7 年的数据。
卡车司机在送货点使用他的移动设备扫描发票。图像识别程序扫描发票并添加
从图像中捕获的元信息。元信息将包括发货地和收货地以及其他信息。
货运公司可以看到其所有发票,发货组织可以查看所有发货地与其匹配的发票,
类似的规则适用于收货地。
问题
您将如何设计一个系统以经济高效的方式存储所有这些数据。
您将如何设计授权系统以确保组织只能根据上述规则查看发票。
使该解决方案在全球范围内可用的设计考虑因素是什么?
-- --