数据安全如何破局？丨TF111回顾

阅读量:137 2023-07-24 收藏本文

7月6日，CCF TF第111期活动“数据安全如何破局？”邀请到了4位钻研数据安全领域的专家：北京交通大学计算机学院副院长李浥东，北京天空卫士网络安全技术有限公司董事、合伙人杨明非，杭州领信数科信息技术有限公司总裁张震宇，聚中软件（上海）有限公司CEO杜绍森。他们从学术、应用、技术、业务等不同角度与我们一起探讨数据安全的破局之路。

CCF TF活动相关专家报告均收录在CCF数字图书馆【TF专辑】，欢迎长按识别，回看精彩分享。本期活动报告也将于近日收录，欢迎持续关注！

国家领导人强调，“要构建以数据为关键要素的数字经济”；“要维护国家数据安全，保护个人信息和商业秘密，促进数据高效流通使用、赋能实体经济，统筹推进数据产权、流通交易、收益分配、安全治理，加快构建数据基础制度体系”。

本期技术前线的主题是“数据安全如何破局？”。过去的这些年，我国数据安全立法脚步加紧，但对于企业来说，买什么样的数据安全产品？怎么做好数据安全才能保证合规？如何平衡好业务与安全之间的关系？如何规划好安全的成本与效率？在这些方面依然存在诸多困惑。为此，CCF TF第111期邀请到了4位学术界以及产业界的专家，从学术、应用、技术、业务等不同角度与我们一起探讨数据安全的破局之路。

本次活动由CCF TF安全SIG呈现。

大数据安全：现状、挑战与未来：

北京交通大学计算机学院副院长李浥东是国内数据安全学术界的专家，他指出，2025年全球数据产生量预计达175ZB，全球数据量即将迎来更大规模的爆发；工业和信息化部日前发布《“十四五”大数据产业发展规划》提出到2025年，我国大数据产业测算规模将突破3万亿元；近期以ChatGPT为代表的人工智能大模型训练数据达到了45TB……数据已成为生产要素之一，大数据时代已经到来。

然而，在与信通院的联合调研结果显示，企业对于开展共享流通持谨慎保守态度，主要面着临基础差、没有相应的技术手段保障等问题，商业机密和数据主权是企业最为担心的两个问题。大数据安全威胁渗透在数据生产、采集、处理和共享等大数据产业链的各个环节，风险成因复杂交织。既有外部攻击，也有内部泄露。既有技术漏洞，也有管理缺陷。既有新技术新模式触发的新风险，也有传统安全问题的持续触发。

面对以上挑战，李浥东给出了当前解决数据安全问题的诸多主流技术与方案，包括数据治理主流技术框架、数据安全主流技术框架、基于神经微分方程的鲁棒性研究、隐私计算主流技术框架、安全多方计算技术、差分隐私、同态加密、联邦学习、可信执行、公平性主流技术框架、可信数据智能的公平性等，并详细讲解了各种技术的概念以及对应可以解决的现实问题。

最后，李浥东讲解了包括工业数据空间、平行安全、通用隐私计算、新基建，新安全在内的潜在研究方向，以及运用行业典型的应用案例进行生动的讲解。

人工智能时代的企业数字化转型与数据安全：

北京天空卫士网络安全技术有限公司董事、合伙人杨明非指出，生成式人工智能普及正在加速数字化转型，如OpenAI所说，“数据安全不再只是一个技术问题，它是组织拥抱数字化转型并利用人工智能的力量保护其宝贵数据资产的战略要务。”AI极大提高生产效率，但因为数据安全的风险使很多大型企业和组织望而却步，例如敏感的公司数据可能会泄露给外部的AI工具，然后再泄露给其他用户。杨明非详解了人工智能应用场景下的数据安全风险，并指出只有解决好数据安全的问题，才能保证海量数据的安全共享与传输。

他指出，数据安全治理是重塑数字大厦根基的根治性举措，数据安全治理是一个组织在全面理解其数据使用、存储和传输的情况下，实施和管理的一套策略和程序，以保护其数据资产并遵守数据保护法规。数据安全治理的主要目标是确保数据的可用性、完整性、准确性和安全性，同时遵守相关的法律、政策和行业规范。杨明非详细分享了如何进行场景化的安全风险评估与防护，指出数据分级分类是数据安全治理的重点，同时强调员工安全意识教育是数据安全治理中容易被忽略的要点。

站在实践的角度，杨明非分享了人工智能应用数据防泄密与违规出境防护、基于人工智能的人员数据安全评估、数据安全中台-数据生命周期保护、天空卫士数据安全治理自动化平台等方案和案例，具备非常强的实践参考价值。

数据安全的前哨——数据分类分级技术的研究

杭州领信数科信息技术有限公司总裁张震宇抓住目前数据安全治理中最重要的环节“数据分类分级”这一重点进行深入分享。他指出，目前数据分类分级的痛点与难点包括数据安全管理不合法、不合规；数据治理工作量大；分类分级缺少统一的方法论（行业/组织对分类分级的理解方式各不相同）；网关作为统一入口仍存在问题；分类分级工具自动识别率普遍低；深入分类分级管理涉及大量定制情形等……

分析挑战的同时，张震宇也基于多年数据安全治理经验给出了分类分级的解决方案，明确指出数据分类分级的核心思路，以及国家相关标准对于分级标准的落地思路，总结了库表分级整体流程、应用人员登录平台填写分类分级流程、业务人员登录平台进行定级工作流程；分享了分级结果关联脱敏、差分隐私脱敏、权限账号关联等重要技术路线。

张震宇指出，成功的数据分类分级所需要的人工资源为传统方法的20%-30%，可使效率提升4-5倍，同时性能可靠（两万张表单，200万个字段能够实现自动分类分级闭环），在大数据环境下实现数据自动分类分级的完整闭环。

湖仓数据安全——-数据安全与价值一体化

聚中软件（上海）有限公司 CEO杜绍森指出，数据仓库、数据湖和数据中台是数据最多、用户最多、数据价值密度最高的地方，数据安全需要解决的问题是如何安全有效地发挥数据本身的价值以及数据的流通价值，所以解决好数据湖仓中的“人”与“数据”的问题，是解决好数据安全问题的根本。

杜绍森指出，湖仓存储、应用领域普遍存在账户（用户）共享、无用户、弱用户的情况，以及应用用户过度授权访问数据存储的情况。湖仓身份构建是授权、审计、脱敏、加密等技术的基础，也就是说要首先解决“我是谁”的问题。然后通过数据资产识别和管理，基于NLP和知识图谱等技术持续动态的过程(define+、Risk+)，对敏感结构或者非结构化数据的分布进行梳理、归类，来解答“数据是什么”的问题。接下来，构建data virtualization支撑的数据业务化安全，关注业务对象(Business Object)，为数据、元数据(Metadata)建立有业务意义的上下文，简化数据安全，让安全更有业务含义，解决“数据安全使用”的问题。

杜绍森最后指出湖仓数据安全治理的目标与效果是一体化、自动化，使安全与价值融合，使安全与治理融合。

在最后的研讨与答疑环节，主持人以及各位专家解答了很多观众提出来的问题，例如“结构化数据在与其他单位进行数据共享场景当中，如果出现了数据泄露，如何溯源并确定数据泄露的责任主体？”“目前随着人工智能技术的发展，基于AI的数据分类分级目前在实际产品及方案中的应用情况如何？所达到的实际效果如何？面临的挑战有哪些？”“结构化数据的敏感数据发现和分类分级中，一种方式是通过抽样数据的方式，在抽样的时候如果有许多没有数据的字段，这种情况如何识别判定？”“数据的分类分级中通过工具自动化识别和分类分级之后，免不了需要核查的过程，如果有大量数据需要核查有什么好的办法？”现场观点碰撞、讨论热烈、精彩纷呈，为线下和线上的参与观众们带来了一场关于数据安全的知识盛宴。

关于CCF TF

CCF TF技术前线（Tech Frontier）创立于2017年6月，旨在为工程师提供顶级交流平台，更好地服务企业界计算机专业人士，帮助企业界专业技术人士职业发展，通过搭建平台实现常态化合作和发展，促进企业间、学术界与企业间技术交流。目前已组建知识图谱、数据科学、智能制造、架构、安全、智能设备与交互、数字化转型与企业架构、算法与AI、智能前端、工程师文化、研发效能、软件质量工程等十二个SIG（Special Interest Group），提供丰富的技术前线内容分享。2023年全年，CCF TF将在线开展20场活动，会员免费参加。

加入CCF

加入CCF会员享受更多超值活动，为自己的技术成长做一次好投资。

点击链接了解更多会员权益：

CCF个人会员权益 CCF公司会员权益

识别或扫码入会

欢迎关注CCFTF及CCF业务总部公众号，精彩陆续开启！

关注CCFTF获取TF活动资讯

关注CCF业务总部优惠预定会议场地

合作单位

<<< 上一篇关于发布CNCC2023技术论坛（第二批）的公告

早鸟票倒计时2天，山东大学彭朝晖邀你共论拔下一篇 >>>

<<< 下一篇早鸟票倒计时2天，山东大学彭朝晖邀你共论拔