欢乐 Gnusmas!
计算机素养绝对应该在成年人口中普及,并有望在所有青少年人口中普遍发展。我不确定编程素养是这种素养最重要的组成部分。虽然老话说“编程或被编程”有一定道理,但我目前更关心公众的数据素养水平。围绕反恐、执法等公共政策讨论充满了关于“机构间信息共享”的说法,而受到广泛关注的消费者问题包括“隐私政策”、“数据经纪人”和据称已剥离“个人身份数据”的数据集。作为一种预防措施或公共卫生措施,我建议开设一门高中课程,如果不是必修课,也强烈鼓励开设,介绍数据库概念,或许可以使用 SQL(在我看来,SQL 的学习曲线平缓而直观,但我的经验可能不典型)。我希望这个介绍至少让学生了解表连接的概念。这是因为(在我看来)SQL 的“魔力”就发生在这里。这就是为什么访问两个数据集所赋予的信息力量(而信息 *就是* 力量)比访问一个数据集所赋予的信息力量多两倍以上。我提议的数据素养课程的练习将提出如下问题:
* 您将如何尝试从这个已被剥离识别信息的数据集中的记录中推断出个人身份?
* 您将如何设计一个系统,用于计算此数据集中每个[人、产品、地点等]的数字“评分”,您的目标是更高的评分可能预示着更高的[犯罪发生、贷款拖欠、消费者购买等]概率?
* 您将如何构建推荐引擎?同样,我希望看到重点更多地放在选择什么数据以及数据关系来纳入推荐,以及以何种方式纳入,而不是编码上。
还有一件事:我参加过的(在传统学院和大学中)太多编程课程都过分依赖于过于简化和不切实际的准商业问题。我似乎还记得一个“为一家简单的假设航空公司编写一个简单的预订系统”之类的东西。难怪没有入门级工作这种东西。我希望数据素养课程的数据集是经验性的,也就是说,真实世界的数据。我也希望至少有一些数据集是比较大的。请记住,(不幸的是,为了我的目的)信息并不想免费,一些课堂作业可能是数据收集作业,也许是派学生出去进行一些调查,或者记录食物日记,或者进行一些 GPS 调查等等。
作者评论
欢乐 Gnusmas!
计算机素养绝对应该在成年人口中普及,并有望在所有青少年人口中普遍发展。我不确定编程素养是这种素养最重要的组成部分。虽然老话说“编程或被编程”有一定道理,但我目前更关心公众的数据素养水平。围绕反恐、执法等公共政策讨论充满了关于“机构间信息共享”的说法,而受到广泛关注的消费者问题包括“隐私政策”、“数据经纪人”和据称已剥离“个人身份数据”的数据集。作为一种预防措施或公共卫生措施,我建议开设一门高中课程,如果不是必修课,也强烈鼓励开设,介绍数据库概念,或许可以使用 SQL(在我看来,SQL 的学习曲线平缓而直观,但我的经验可能不典型)。我希望这个介绍至少让学生了解表连接的概念。这是因为(在我看来)SQL 的“魔力”就发生在这里。这就是为什么访问两个数据集所赋予的信息力量(而信息 *就是* 力量)比访问一个数据集所赋予的信息力量多两倍以上。我提议的数据素养课程的练习将提出如下问题:
* 您将如何尝试从这个已被剥离识别信息的数据集中的记录中推断出个人身份?
* 您将如何设计一个系统,用于计算此数据集中每个[人、产品、地点等]的数字“评分”,您的目标是更高的评分可能预示着更高的[犯罪发生、贷款拖欠、消费者购买等]概率?
* 您将如何构建推荐引擎?同样,我希望看到重点更多地放在选择什么数据以及数据关系来纳入推荐,以及以何种方式纳入,而不是编码上。
还有一件事:我参加过的(在传统学院和大学中)太多编程课程都过分依赖于过于简化和不切实际的准商业问题。我似乎还记得一个“为一家简单的假设航空公司编写一个简单的预订系统”之类的东西。难怪没有入门级工作这种东西。我希望数据素养课程的数据集是经验性的,也就是说,真实世界的数据。我也希望至少有一些数据集是比较大的。请记住,(不幸的是,为了我的目的)信息并不想免费,一些课堂作业可能是数据收集作业,也许是派学生出去进行一些调查,或者记录食物日记,或者进行一些 GPS 调查等等。