历史上的今天
返回首页

历史上的今天

今天是:2024年10月06日(星期日)

2019年10月06日 | 语言是如何塑造密码安全性的

2019-10-06 来源:EEWORLD

翻译自——spectrum,Jeremy Hsu

 

中文和英文密码的差异对现在流行的Web服务有很大的安全影响。

 

Image of a password field with the password filled in

 

无论语言和文化有何不同,中、英文互联网用户都能在通过使用“123456”等密码变体时找到共同点。但最近研究发现,从比较两种语言密码模式来看,中文密码具有显著而独特的特点,对中国以外的互联网安全具有重大影响。

 

令人惊讶的是,由于使用中文用户的密码只占全球互联网用户总数的20%,所以一直没有得到充足的研究。据统计,仅中国就有8.54亿互联网使用者,是美国总人口的两倍多。为此我们开始了一项研究,测试中文和英文用户的密码安全性是如何对抗最好的破解算法的。

 

“我们的工作可能是第一批研究不同语言的密码所带来的影响的机构,”北京大学信息安全研究员丁旺表示。

 

丁旺和他的同事分析了2009年至2012年间被黑客泄露的9项网络服务的1.06亿个真实密码,其中6项中文服务有7300万个以及3项英文服务有3300万个。他们只从类似Web服务同行之间的混合社会论坛、游戏服务,电子商务网站、程序员论坛,加上雅虎门户在英文方面的数据集进行了细细的比较。

 

基于英语的那些高强度密码实际上可能非常弱,而且从汉语角度来看很容易猜出来。事实上,世界上许多流行的网络服务,包括一些中国本土的服务,都是从英语的角度来考虑密码安全问题的。

 

研究人员指出,像流行的中文密码“woaini1314”,目前被美国在线(AOL)、谷歌,甚至流行的中国社交网络新浪微博(以及IEEE Spectrum的母公司IEEE)评委了高强度密码。但说普通话的人很容易猜到“woaini1314”的密码,因为“woaini”在汉语拼音中是“我爱你”,而“1314”在汉语中是“永远”的意思。

 

中、英文密码的一个主要区别是,许多中文用户喜欢纯数字密码。除了傻瓜式的“123456”,其他在中文用户中流行的密码还包括“111111”、“123123”和“123321”。用“5201314”作为爱情的主题,是因为它听起来像中文里的“我爱你,直到永远”,这个相对来说比较好记。一些常用的密码段会在数字串中添加一个字母,比如“a12345”和“12345a”。

 

中文用户也经常使用手机号码或特定日期(可能是他们的生日)作为密码。相反,英语用户经常只使用字母组成密码,并倾向于某些特定的单词或短语,比如容易猜到的“password”、“letmein”、“sunshine”和“princess”。国外也有一下傻瓜式的密码包括“abcdef”和“abc123”以及“123456”。

 

数字组合只基于10个可能的数字,而不是现代英语字母表中的26个字母,所以只使用数字的密码比只用字母的密码更容易破解。有时会使用中文密码的用户会展示出难以置信的复杂和创造性的密码,比如中国软件开发人员网络(CSDN)的一些成员将编程语言命令与中国传统诗歌结合起来。

 

弗吉尼亚州夏洛茨维尔市弗吉尼亚大学的计算机科学家、该研究的合著者袁田说到:“中国用户在字母和数字的组合上真的很有创意。”

 

研究人员使用的密码文件包含泄露或被盗密码的散列,而不是密码本身的纯文本版本。研究人员试图用两种最先进的密码破解算法来破解中文和英文密码。他们测试了Markov-chain模型和概率上下文无关语法(PCFG)模型,前者根据密码字符之间的关系为密码字符分配一定的概率,后者在猜测最可能组合的顺序之前将密码解析为字母段、数字段和符号段。

 

该团队还改进了PCFG方法,使之适用于更常见的中文密码模式。例如,他们增加了流行的日期格式的数字段和用罗马拼音系统编写的中文名字。他们还赋予了基于PCFG算法处理交织模式的能力——在许多中文密码中发现的交替数字和字母串。

 

总的来说,这些改进提高了基于PCFG的算法对中文密码集的性能——它破解的密码比标准版本的算法多破解了98%到188%。

 

此外,调查结果还显示了与英文密码相比,中文密码的优缺点。当猜测次数限制在1万次或更少时,这两种算法破解中文密码更容易。但事实证明,其余的中文密码比英文密码更强,因为猜测次数已经超过1万次。

 

猜测的数量很重要,因为许多Web服务在临时锁定用户帐户之前都会限制在线猜测的数量。泄露或被盗的密码存储文件可以让黑客进行理论上无限次的离线猜测攻击,因为他们不必处理可能被锁定在Web服务之外的问题。但是,即使是离线猜测攻击,也会受到计算时间和猜测尝试上成本效益的限制。

 

在这两种破解算法中,当你有机会进行10000次或更多次数的猜测时,数据显示,基于markov的算法表现最佳。通过比较,基于PCFG算法在猜测次数较少的情况下,性能与基于markov算法相当,甚至更好。由于PCFG比基于markov的方法少了31%的计算量和70%的内存,可以说PCFG方法也是最有效的。

 

从安全角度来看,这项研究对那些有着大量中文用户的网络服务公司,或者希望有一天能吸引众多中文用户的公司来说,都具有重大意义。袁田表示:安全管理员可能会考虑调整密码创建策略和强度表,来适应最流行的中文密码和未来的变体。

 

所以说,为了你的安全,在设置密码的时候,这种“123456”和“111111”等傻瓜式和以永恒爱情为主题的字母/数字混合模式密码,就不要在使用了。同样的道理也适用于仍然使用“123456”和“abcdef”的英语用户们,否则后果很严重。

 

在中文社区中,语言对密码影响的复杂性会更为强烈。

 

我们中国人使用汉语通常依靠同一套汉字进行阅读和写作,但口语中由于地方方言的不同而存在多种地域差异,这些差异在发音上可能听起来不同。举个例子,由于我们中国地大物博,各个地区或多或少都有方言,仅仅一句“我爱你”就会有许多发音,如果是闽南或者香港地区,乍一听以为是外语。

 

所以,各个地区汉语口语的差异超出了此次研究的范围。但袁田注意到,如果按照广东话、福建话、上海话或其他中国方言变体,试图根据发音创建密码,那么密码模式可能会有所不同,说不定会很有趣。

 

作为更深入研究的一部分,研究人员希望继续评估中文密码模式,通过调查来更好地了解中国互联网用户在创建密码时的想法。他们还提出了继续研究除中英文以外的不同语言密码的可能性。

 

“为了我们未来的工作,我们希望继续研究覆盖中国以外的世界各地的密码,”丁旺表示。

推荐阅读

史海拾趣

DMC Tools公司的发展小趣事

DMC Tools公司深知质量是企业的生命线。因此,公司建立了严格的质量管控体系,从原材料采购到生产加工、再到产品检验,每一个环节都严格把关。这种对质量的执着追求使得DMC Tools公司的产品赢得了客户的广泛信任。许多知名电子企业都选择DMC Tools公司作为他们的长期合作伙伴,这也为公司的发展奠定了坚实的基础。

Advanced Photonix公司的发展小趣事

在电子行业的早期,Advanced Photonix以其卓越的光学技术脱颖而出。公司创始团队由一群富有远见的科学家和工程师组成,他们专注于研发高速光电子和高性能的光纤测试产品。经过无数次的实验和试错,团队终于成功开发出一种具有创新性的光纤传感技术,这一技术为电信行业提供了前所未有的分布式光纤传感解决方案。这一技术突破不仅为Advanced Photonix赢得了市场声誉,也奠定了公司在电子行业的重要地位。

锋鸣电子(Fengming)公司的发展小趣事

随着新能源和储能市场的快速发展,福斯特公司也积极拓展相关业务领域。公司不仅关注光伏材料的研发和生产,还将目光投向了动力电池及储能领域。例如,公司推出的铝塑复合膜产品已完成一期2000万平米扩产项目,并计划未来进一步拓展至动力电池及储能领域。这一举措不仅丰富了公司的产品线,还为公司带来了新的增长点和发展机遇。同时,福斯特还加强与新能源产业链上下游企业的合作,共同推动新能源和储能产业的发展。

Achronix Semiconductor Corporation公司的发展小趣事

在稳固光伏胶膜市场的同时,福斯特并未停止前进的步伐。公司积极拓展产品品类,进入电子新材料领域。2014年,公司开始开发PCB用感光干膜,进军电子信息产业。感光干膜作为PCB产业最核心的工艺材料之一,对电子信息产业的发展具有重要意义。福斯特凭借其技术实力和市场洞察力,迅速在该领域取得突破,成为行业内的佼佼者。至2020年,公司感光干膜销量大幅增长,为公司带来了新的增长点。

Digital Equipment Corp公司的发展小趣事

1998年,DEC被康柏公司以96亿美元的价格收购。这次收购标志着DEC成为康柏公司的一部分,开始了新的发展历程。在收购后,DEC的品牌和产品得到了保留和发展,同时康柏公司也为DEC带来了更多的资源和支持。通过业务整合和资源共享,DEC在康柏公司的领导下继续保持着其在计算机行业的领先地位。

C&K Switches公司的发展小趣事

2022年,C&K Switches公司被Littelfuse以5.4亿美元的企业价值收购。Littelfuse是一家工业技术制造公司,致力于打造一个可持续、互联和更安全的世界。两家公司在工业、通讯以及车载领域有着相近的市场布局和业务高度互补。收购完成后,C&K成为Littelfuse电子业务部门的一部分,双方共同为客户提供更全面的解决方案。这一收购不仅加强了C&K的市场地位,还为其未来的发展注入了新的活力和机遇。

问答坊 | AI 解惑

谁有中文版电子电路设计软件下载地址?

谁有中文版电子电路设计软件下载地址?…

查看全部问答>

在linux2.6.9中添加dm9000a驱动问题

我想在pxa270的开发板上移植dm9000a的驱动,在driver/net目录下,添加了网上下载的dm9ks.c文件,也修改了makefile和Kconfig文件,编译进了内核,但是总是没有启动初始化,因为我在初始化函数中添加了一条printk函数,内核启动时,没有输出显示,请 ...…

查看全部问答>

ctrl c问题,大家指教。

本人在一块嵌入式的板子上跑了个linux系统,通过nfs挂接pc机上虚拟机的文件系统,但是现在在串口下用ctrl c失效,但是如果telnet到上面是可以用ctrl c的,而且挂接别的文件系统是可以正常用ctrl c。 不知哪里出了错?或那个配置文件有问题,小弟对 ...…

查看全部问答>

CAB 安装包解问题

问个无知的问题,我们都知道Windows Mobile上的安装包是CAB格式,解压后有一个setup.xml来描述 内部安装文件和注册表,但是有些第三方应用解压后看不到setup.xml,不知道是用什么工具打包的,微软的工具打包出来是有setup.xml的。 比如arcsoft的软 ...…

查看全部问答>

关于tcpmp播放器背景播放的问题!

我下的版本是tcpmp.src.0.72RC1,通过修改,现在可以在应用中实现控制player_ce3.exe的play、stop、pause、exit的功能了, 我的目的是想通过该播放器在背景播放MP3,遇到很多问题,想问问大家: 1、我在界面中点选了一首mp3后,通过CreateProcess ...…

查看全部问答>

KEIL C51报错 UNCALLED SEGMENT

*** WARNING L16: UNCALLED SEGMENT, IGNORED FOR OVERLAY PROCESS    SEGMENT: ?PR?_DELAY?CH5_2*** WARNING L16: UNCALLED SEGMENT, IGNORED FOR OVERLAY PROCESS    SEGMENT: ?CO?CH5_2不明白是什么意思...谁懂的 ...…

查看全部问答>

传递参数错误

C写的,在一个函数调用子函数时,向子函数传递的参数值出现错误,如: func1() {     int i=0;     i=**;    func2(i); } func2(int x) { } 在调试中进入func2,发现x不是需要的**,哪位大侠指点下.…

查看全部问答>

初学者请教

本帖最后由 dontium 于 2015-1-23 13:22 编辑 小女子初学DSP,使用的是6416的开发板 请问6416自带的例程SDRAM, 其中有一个数组sdram_data[0x10000],为什么后面的赋值语句 for(i = 0; i < 0x400000; i++)     {     &n ...…

查看全部问答>

JX51开发板2.3发布。欢迎各位来捧场!

以前做过一个1.0,但是其中存在着不少问题,经过改进现在发布2.3版本。。。  板子正在制作过程中。。。     板子的资源: 1.  STC 89S52单片机 2.  8*8双色点阵 ,使用3颗74HC595控制 3.  8个流水灯 4.&nbs ...…

查看全部问答>