AI Challenger 2018:细粒度用户评论情感分析冠军思路总结
来源 2018年8月-12月,由美团点评、创新工场、搜狗、美图联合主办的“AI Challenger 2018全球AI挑战赛”历经三个多月的激烈角逐,冠军团队从来自全球81个国家、1000多所大学和公司的过万支参赛团队中脱颖而出。其中“后厂村静静”团队-由毕业于北京大学的程惠阁(现已入职美团点评)单人组队,勇夺“细粒度用户评论情感分类”赛道的冠军。本文系程惠阁对于本次参赛的思路总结和经验分享,希望…
来源 2018年8月-12月,由美团点评、创新工场、搜狗、美图联合主办的“AI Challenger 2018全球AI挑战赛”历经三个多月的激烈角逐,冠军团队从来自全球81个国家、1000多所大学和公司的过万支参赛团队中脱颖而出。其中“后厂村静静”团队-由毕业于北京大学的程惠阁(现已入职美团点评)单人组队,勇夺“细粒度用户评论情感分类”赛道的冠军。本文系程惠阁对于本次参赛的思路总结和经验分享,希望…
本技术博客只用于实验环境的测试学习,不可用于其他用途,否则造成的后果自行承担! 1.查看网卡并启动相应网卡的监听模式 ifconfig -a airmon-ng start wlan1 启动监听模式之后网卡名称会变为wlan1mon(根据具体网卡名而有所不同,如:wlan0mon) 查看网卡的工作模式可以用: iwconfig wlan1mon 查看Mode字样,如果为Monitor则确定当前网卡…
说白了,就是所有的计算都要转换成数字,首先分词,词集合,转换成ID,然后匹配即可,这种模式比较粗糙。 词向量余弦 词向量余弦算法,是将文本作为一个多维空间的向量,计算两个文本的相识度即计算判断两个向量在这个多维空间中的方向是否是一样的。而这个多维空间的构成是通过将文本进行分词,每个分词代表空间的一个维度。 下面通过例子来说明多维空间的构成即词向量问题。比如要计算如下两个短文本的相识度: 文本一:天…
一、安装编译所需要的数据包 apt-get install dpkg-dev fakeroot build-essential apt-get install autoconf automake libglib2.0-dev libgda2-dev gda2-mysql zlib1g-dev libssl-dev 注:使用apt-get install安装过程中,有可能出现无法下载某些 软件名.d…
这是在测试项目的时候,发现上传用户头像有一个问题,然后引发的探索: 代码: /** 修改头像 */ - (void)modifyHeadshot { /*头像*/ NSString *mediaType = AVMediaTypeVideo; AVAuthorizationStatus authorizationStatus = [AVCaptureDevice authorizationStat…
1、单向散列加密 单向散列加密是通过对不同输入长度的信息进行散列计算,得到固定长度的输出,单向的(不可逆)。 用户的密码通过此加密将密文存在数据库当中,登录时根据用户输入的密码进行加密后与数据库中的密文进行对比。 这样即使平台数据库被“拖库”,也不会造成用户的密码泄漏。 代表:MD5算法 SHA算法 MD5功能: 输入任意长度的信息,经过处理,输出为128位的信息(数字指纹); 不同的输入…
在colab上运行下载文件的脚本出错 Access denied with the following error: Cannot retrieve the public link of the file. You may need to change the permission to 'Anyone with the link', or have had many accesses. You …