ubuntu下文本标注工具BRAT全程离线安装

  • Post author:
  • Post category:其他




1 Apache离线安装



1.1 软件下载



1.1.1 httpd文件



http://httpd.apache.org/download.cgi

下载httpd文件

在这里插入图片描述



1.1.2 apr文件

可到官网

http://apr.apache.org/

下载apr。

在这里插入图片描述



1.1.3 apr-util文件

从官网

http://apr.apache.org/

下载apr-util。

在这里插入图片描述



1.1.4 pcre文件

从官网

http://www.pcre.org/

下载PCRE。



1.1.5 expat文件

由于系统缺失expat库,需要另外下载expat源码包并安装,否则安装apr-util环境会出错。

下载地址:


https://sourceforge.net/projects/expat/files/expat/2.2.9/



1.2 安装

下载完成后,分别解压这些安装包。

tar -zxvf apr-1.7.0.tar.gz
tar -zxvf apr-util-1.6.1.tar.gz
tar -zxvf pcre-8.43.tar.gz 
tar -zxvf httpd-2.4.39.tar.gz
tar -zxvf expat-2.2.9.tar.gz

解压完成后,会出现解压的目录。

然后分别进入四个目录,执行以下命令

cd expat-2.2.9
./configure
make
make install

cd ../apr-1.7.0
./configure --prefix=/usr/local/apr (指定安装目录)
make
make install

cd ../apr-util-1.6.1
./configure --prefix=/usr/local/apr-util --with-apr=/usr/local/apr
make
make install

cd ../pcre
./configure --prefix=/usr/local/pcre
make
make install

cd …/httpd-2.4.39
./configure --prefix=/usr/local/httpd --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr-util --with-pcre=/usr/local/pcre
make
make install

默认安装httpd后在/usr/local/httpd/modules下没有cgi模块,可以通过apxs命令进行离线编译安装cgi,mod_cgi.c在httpd源码中查找。

cd /usr/local/httpd/bin
./apxs -i -a -c /home/jcsa/httpd/modules/generators/mod_cgi.c

在这里插入图片描述

将Apache加入系统服务中(待验证):

cp /usr/local/httpd/bin/apachectl /etc/rc.d/init.d/httpd

2、设置开机自己启动

sudo update-rc.d -f httpd defaults
利用服务启动httpd
service httpd start
查看状态
service httpd status

参考:

Ubuntu下apache开机自启



1.3 文件配置

一切都按照流程安装完成后,进入目录 /usr/local/httpd/conf/

打开httpd.conf文件:

`vim httpd.conf`

找到文件中的 #ServerName www.example.com:80

修改为:ServerName 192.168.190.156:80(自己的IP)

在本地浏览器访问apache服务,显示以下内容,表示Apache服务正常。

在这里插入图片描述

确保httpd.conf文件中mod_cgi模块加载进来。

在这里插入图片描述



2 brat安装

brat是一个文本标注工具,可以标注实体,事件、关系、属性等,只支持在linux下安装,其使用需要webserver,官方给出的教程使用的是Apache2。



2.1 下载brat软件

建议下载brat的release版本地址:


https://github.com/nlplab/brat/releases/tag/v1.3p1


httpd安装成功后,将下载的brat软件解压到/usr/local/httpd/htdocs/brat

使用如下命令对brat目录授权:

sudo chmod 777 -R /usr/local/httpd/htdocs/brat

进入brat目录

cd /usr/local/httpd/htdocs/brat 

执行以下命令,根据提示输入用户名、密码、管理员邮箱

sudo ./install.sh

2.2 配置

打开httpd.conf文件:vim httpd.conf或者gedit httpd.conf

增加

<Directory /usr/local/httpd/htdocs/brat>

AllowOverride Options Indexes FileInfo Limit

Require all granted

AddType application/xhtml+xml .xhtml

AddType font/ttf .ttf

Options +ExecCGI

AddHandler cgi-script .cgi

重启httpd后

cd /usr/local/httpd/bin
sudo ./apachectl restart

访问以下网址http://127.0.0.1/brat/

在这里插入图片描述



3 brat使用



3.1 设置中文标注

brat默认不支持中文标注,需要手动修改brat主目录/server/src路径下的projectconfig.py文件的第162行代码,注释源代码,然后另起一行加入新代码(修改之后记得重启apache2服务):

# n  = re.sub(r'[^a-zA-Z0-9_-]', '_', n)
n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)

请确保python2环境存在,并且python软连接指向的是python2,否则brat可能运行报错(最新的release版本只支持python2),如果需要安装python3可以建立新的软连接,名字叫python3即可;当然这只是参考处理方案,也可以采用虚拟环境的方式在python2下运行brat。



3.2 添加多个用户

找到config.py 对应的行,增加:

USER_PASSWORD = {
'admn': 'admin',
'test': 'test',
# (add USERNAME:PASSWORD pairs below this line.)
}



3.3 准备数据

把数据放进文件夹中,比如我把数据(即filename.txt文件,filename为文件名)放在data/project/中。每一个句子独立成一个.txt文件。然后按下列操作就可以给data文件夹中每一个.txt文件都产生一个.ann文件。

find data -name '*.txt' | sed -e 's|\.txt|.ann|g' | xargs touch

另外再对新添加的文件夹添加读写权限:

chmod –R 777 ./



3.4 实体标注


brat需要登陆用户,才能进行标注,否则会点击文本不出现实体类型弹窗。

对文本进行实体标注时,如果Options下Annotation options设置为Careful,点击实体类型后,需要再增加一个点击确定的操作。如果Annotation options设置为Normal,则双击实体类型即可完成操作。

在这里插入图片描述



错误解决

如果使用brat加载本地文件的时候报错“unable to read text file xxx/xxx/xxx/xxx.txt ”,请确保你的txt文件已经授权给当前linux系统的登录用户,授权方式可以参考如下方式:

sudo chmod 777 xxx.txt



4 参考


中标麒麟操作系统6.7版本下安装Apache-2.4.39



Ubuntu 12.94 离线安装(部署)Apache(Apache-2.4.7)



用深度学习做命名实体识别(二):文本标注工具brat



文本标注工具brat部署笔记

所有的离线安装包地址:

https://download.csdn.net/download/maoersong/12191533



版权声明:本文为maoersong原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。