一种基于词嵌入技术的域名相似性分析方法
专利号
2019102204186
发明人
万长胜;李静
专利权人
东南大学
专利类型
发明专利
专利授权日
2022-01-21
技术领域
电子信息
转让价格
面议
专利介绍
本发明公开了一种基于词嵌入技术的域名相似性分析方法。本发明的方法包括步骤:(1)数据收集与处理阶段,收集DNS查询数据并进行预处理,构建域名词表和用户访问域名序列;(2)数据表示学习阶段,经过预处理的数据传入无监督模型Skip?gram,设置相关参数,通过Skip?gram模型训练域名向量;(3)数据应用阶段,通过域名向量计算域名相似度,分析用户行为偏好。本发明有效解决了对数据和人工的依赖;应用简单,可以在任何网络环境中部署,满足实时性需求。
联系方式
- 电话
025-83792678
- 邮箱
ttc@seu-ttc.com
- 地址
南京市玄武区太平北路138号
技术转移中心公众号
- 扫码关注了解最新动态