一年前,风靡全球的人工智能聊天机器人ChatGPT改变了世界,如今,生成式人工智能(Genai)正在成为一种变革性技术,有可能彻底改变企业和行业。印度表示,将制造负责任的人工智能(AI),并对其进行监管,使其仅用于“建设性目的”,并在国内安全使用。然而,整个行业面临的一个巨大挑战是人工智能工具在其算法和软件中嵌入的固有偏见,这种偏见继续困扰着这项技术。
德国软件巨头SAP表示,它正在努力确保生成式人工智能不受任何刻板印象的影响。早在围绕GenAI的炒作浮出水面之前,它就声称拥有人工智能专家委员会。
SAP支持基于风险的人工智能监管方法。它指出,人工智能是效率和气候行动的游戏规则改变者,印度可以在这一领域发挥领导作用。
“很高兴看到印度政府正在制定面向未来的人工智能政策。就人工智能整体监管而言,我们仍然认为世界各国政府需要在创新和监管之间取得适当的平衡。我们期待着审查这些建议,并继续与政府和行业机构合作,推进人工智能的新方法,”SAP的一位代表告诉ABP Live。
该公司还强调,有必要采取平衡的方法,鼓励创新,同时监管可能危害健康、安全和基本权利的高风险人工智能应用程序。
可能还记得,今年6月,代表It和业务流程管理部门的协会NASSCOM发布了一套全面的负责任的人工智能指导方针,特别是GenAI。这些指导方针旨在定义研究人员、开发人员以及使用GenAI模型和应用程序的用户的规范性责任,促进采用这项技术的负责任方法。为了进一步提高透明度和问责制,必须公开披露用于建模的数据和算法来源。
SAP在最近结束的techhed旗舰活动上大举押注GenAI,推出了一系列生成式人工智能解决方案。SAP推出了一系列GenAI产品,包括SAP HANA Cloud上的矢量引擎、SAP Build Code解决方案和SAP AI Core中的生成式AI中心。为了解决人工智能中的偏见问题,这家德国软件巨头指出,它正在努力消除成见,并确保它不受偏见的影响。
SAP首席学习官Max Wessel在一次互动中告诉ABP Live:“从SAP的研究角度来看,我们正在尝试使用合成数据来开发没有偏见的训练数据集,这样我们就可以以一种克服固有数据偏见的方式调整数据集。”
在训练期间,将AI模型暴露给大量数据的需求可能包括必要数据可能不存在或缺乏全面性的情况。这就是人工智能模型训练过程中合成数据的关键组成部分。此外,为了训练这些基因人工智能技术,需要对来自互联网的数据集进行处理,并采用人为干预来减轻有害的偏见。
根据最近发表在《组织动力学》杂志上的一项研究,研究人员表示,人工智能生成的内容有可能维护和维持有害的性别偏见,而机器偏见是指算法和软件中根深蒂固的偏见。然而,Wessel相信人工智能模型将在未来摆脱固有的偏见。
“随着创新和一些改进,我们将在基础技术中看到,我认为随着时间的推移,它将克服这些人工智能模型和训练数据集的固有偏见。但这也需要你意识到数据与现实不符的地方,”韦塞尔指出。
在人工智能领域,合成数据作为一个新领域出现,据说它可以缓解人工数据采集、注释和清理带来的挑战。这种新颖的方法解决了通过传统手段可能无法获得数据的问题。合成数据生成能够提供与真实数据相同的结果,但在大大缩短的时间范围内,并且不会损害隐私。
全球市场情报公司高德纳(Gartner)的一项研究表明,到2024年,用于人工智能开发的所有数据中,60%将是合成数据,而不是真实数据。
SAP的Wessel为外行人分析了合成数据,他解释说:“合成数据是生成的数据,它与原始数据的属性是真实的,但在创建时,它是以一种与存在的关系类型相匹配的方式创建的。”
事实上,合成数据是一个非常简单的概念——这个想法似乎好得令人难以置信。合成数据本质上允许从业者毫不费力地生成所需的数字数据,按需,以任何所需的数量,并根据他们的确切规格进行定制。