Вход Регистрация
Файл: engine/classes/Fenom/Tokenizer.php
Строк: 569
<?php
/*
 * This file is part of Fenom.
 *
 * (c) 2013 Ivan Shalganov
 *
 * For the full copyright and license information, please view the license.md
 * file that was distributed with this source code.
 */
namespace Fenom;

use 
FenomErrorUnexpectedTokenException;

/**
 * for PHP <5.4 compatible
 */
defined('T_INSTEADOF') || define('T_INSTEADOF'341);
defined('T_TRAIT') || define('T_TRAIT'355);
defined('T_TRAIT_C') || define('T_TRAIT_C'365);
/**
 * for PHP <5.5 compatible
 */
defined('T_YIELD') || define('T_YIELD'267);

/**
 * Each token have structure
 *  - Token (constant T_* or text)
 *  - Token name (textual representation of the token)
 *  - Whitespace (whitespace symbols after token)
 *  - Line number of the token
 *
 * @see http://php.net/tokenizer
 * @property array $prev the previous token
 * @property array $curr the current token
 * @property array $next the next token
 *
 * @package    Fenom
 * @author     Ivan Shalganov <a.cobest@gmail.com>
 */
class Tokenizer
{
    const 
TOKEN      0;
    const 
TEXT       1;
    const 
WHITESPACE 2;
    const 
LINE       3;

    
/**
     * Some text value: foo, bar, new, class ...
     */
    
const MACRO_STRING 1000;
    
/**
     * Unary operation: ~, !, ^
     */
    
const MACRO_UNARY 1001;
    
/**
     * Binary operation (operation between two values): +, -, *, /, &&, or , ||, >=, !=, ...
     */
    
const MACRO_BINARY 1002;
    
/**
     * Equal operation
     */
    
const MACRO_EQUALS 1003;
    
/**
     * Scalar values (such as int, float, escaped strings): 2, 0.5, "foo", 'bar's'
     */
    
const MACRO_SCALAR 1004;
    
/**
     * Increment or decrement: ++ --
     */
    
const MACRO_INCDEC 1005;
    
/**
     * Boolean operations: &&, ||, or, xor, and
     */
    
const MACRO_BOOLEAN 1006;
    
/**
     * Math operation
     */
    
const MACRO_MATH 1007;
    
/**
     * Condition operation
     */
    
const MACRO_COND 1008;

    public 
$tokens;
    public 
$p 0;
    public 
$quotes 0;
    private 
$_max 0;
    private 
$_last_no 0;

    
/**
     * @see http://docs.php.net/manual/en/tokens.php
     * @var array groups of tokens
     */
    
public static $macros = array(
        
self::MACRO_STRING  => array(
            
T_ABSTRACT      => 1,
            
T_ARRAY         => 1,
            
T_AS            => 1,
            
T_BREAK         => 1,
            
T_BREAK         => 1,
            
T_CASE          => 1,
            
T_CATCH         => 1,
            
T_CLASS         => 1,
            
T_CLASS_C       => 1,
            
T_CLONE         => 1,
            
T_CONST         => 1,
            
T_CONTINUE      => 1,
            
T_DECLARE       => 1,
            
T_DEFAULT       => 1,
            
T_DIR           => 1,
            
T_DO            => 1,
            
T_ECHO          => 1,
            
T_ELSE          => 1,
            
T_ELSEIF        => 1,
            
T_EMPTY         => 1,
            
T_ENDDECLARE    => 1,
            
T_ENDFOR        => 1,
            
T_ENDFOREACH    => 1,
            
T_ENDIF         => 1,
            
T_ENDSWITCH     => 1,
            
T_ENDWHILE      => 1,
            
T_EVAL          => 1,
            
T_EXIT          => 1,
            
T_EXTENDS       => 1,
            
T_FILE          => 1,
            
T_FINAL         => 1,
            
T_FOR           => 1,
            
T_FOREACH       => 1,
            
T_FUNCTION      => 1,
            
T_FUNC_C        => 1,
            
T_GLOBAL        => 1,
            
T_GOTO          => 1,
            
T_HALT_COMPILER => 1,
            
T_IF            => 1,
            
T_IMPLEMENTS    => 1,
            
T_INCLUDE       => 1,
            
T_INCLUDE_ONCE  => 1,
            
T_INSTANCEOF    => 1,
            
T_INSTEADOF     => 1,
            
T_INTERFACE     => 1,
            
T_ISSET         => 1,
            
T_LINE          => 1,
            
T_LIST          => 1,
            
T_LOGICAL_AND   => 1,
            
T_LOGICAL_OR    => 1,
            
T_LOGICAL_XOR   => 1,
            
T_METHOD_C      => 1,
            
T_NAMESPACE     => 1,
            
T_NS_C          => 1,
            
T_NEW           => 1,
            
T_PRINT         => 1,
            
T_PRIVATE       => 1,
            
T_PUBLIC        => 1,
            
T_PROTECTED     => 1,
            
T_REQUIRE       => 1,
            
T_REQUIRE_ONCE  => 1,
            
T_RETURN        => 1,
            
T_RETURN        => 1,
            
T_STRING        => 1,
            
T_SWITCH        => 1,
            
T_THROW         => 1,
            
T_TRAIT         => 1,
            
T_TRAIT_C       => 1,
            
T_TRY           => 1,
            
T_UNSET         => 1,
            
T_USE           => 1,
            
T_VAR           => 1,
            
T_WHILE         => 1,
            
T_YIELD         => 1
        
),
        
self::MACRO_INCDEC  => array(
            
T_INC => 1,
            
T_DEC => 1
        
),
        
self::MACRO_UNARY   => array(
            
"!" => 1,
            
"~" => 1,
            
"-" => 1
        
),
        
self::MACRO_BINARY  => array(
            
T_BOOLEAN_AND         => 1,
            
T_BOOLEAN_OR          => 1,
            
T_IS_GREATER_OR_EQUAL => 1,
            
T_IS_EQUAL            => 1,
            
T_IS_IDENTICAL        => 1,
            
T_IS_NOT_EQUAL        => 1,
            
T_IS_NOT_IDENTICAL    => 1,
            
T_IS_SMALLER_OR_EQUAL => 1,
            
T_LOGICAL_AND         => 1,
            
T_LOGICAL_OR          => 1,
            
T_LOGICAL_XOR         => 1,
            
T_SL                  => 1,
            
T_SR                  => 1,
            
"+"                    => 1,
            
"-"                    => 1,
            
"*"                    => 1,
            
"/"                    => 1,
            
">"                    => 1,
            
"<"                    => 1,
            
"^"                    => 1,
            
"%"                    => 1,
            
"&"                    => 1
        
),
        
self::MACRO_BOOLEAN => array(
            
T_LOGICAL_OR  => 1,
            
T_LOGICAL_XOR => 1,
            
T_BOOLEAN_AND => 1,
            
T_BOOLEAN_OR  => 1,
            
T_LOGICAL_AND => 1
        
),
        
self::MACRO_MATH    => array(
            
"+" => 1,
            
"-" => 1,
            
"*" => 1,
            
"/" => 1,
            
"^" => 1,
            
"%" => 1,
            
"&" => 1,
            
"|" => 1
        
),
        
self::MACRO_COND    => array(
            
T_IS_EQUAL            => 1,
            
T_IS_IDENTICAL        => 1,
            
">"                    => 1,
            
"<"                    => 1,
            
T_SL                  => 1,
            
T_SR                  => 1,
            
T_IS_NOT_EQUAL        => 1,
            
T_IS_NOT_IDENTICAL    => 1,
            
T_IS_SMALLER_OR_EQUAL => 1,
        ),
        
self::MACRO_EQUALS  => array(
            
T_AND_EQUAL   => 1,
            
T_DIV_EQUAL   => 1,
            
T_MINUS_EQUAL => 1,
            
T_MOD_EQUAL   => 1,
            
T_MUL_EQUAL   => 1,
            
T_OR_EQUAL    => 1,
            
T_PLUS_EQUAL  => 1,
            
T_SL_EQUAL    => 1,
            
T_SR_EQUAL    => 1,
            
T_XOR_EQUAL   => 1,
            
'='            => 1,
        ),
        
self::MACRO_SCALAR  => array(
            
T_LNUMBER                  => 1,
            
T_DNUMBER                  => 1,
            
T_CONSTANT_ENCAPSED_STRING => 1
        
)
    );

    public static 
$description = array(
        
self::MACRO_STRING  => 'string',
        
self::MACRO_INCDEC  => 'increment/decrement operator',
        
self::MACRO_UNARY   => 'unary operator',
        
self::MACRO_BINARY  => 'binary operator',
        
self::MACRO_BOOLEAN => 'boolean operator',
        
self::MACRO_MATH    => 'math operator',
        
self::MACRO_COND    => 'conditional operator',
        
self::MACRO_EQUALS  => 'equal operator',
        
self::MACRO_SCALAR  => 'scalar value'
    
);

    
/**
     * Special tokens
     * @var array
     */
    
private static $spec = array(
        
'true'  => 1,
        
'false' => 1,
        
'null'  => 1,
        
'TRUE'  => 1,
        
'FALSE' => 1,
        
'NULL'  => 1
    
);

    
/**
     * @param $query
     */
    
public function __construct($query)
    {
        
$tokens  = array(-=> array(T_WHITESPACE''''1));
        
$_tokens token_get_all("<?php " $query);
        
$line    1;
        
array_shift($_tokens);
        
$i 0;
        foreach (
$_tokens as $token) {
            if (
is_string($token)) {
                if (
$token === '"' || $token === "'" || $token === "`") {
                    
$this->quotes++;
                }
                
$tokens[] = array(
                    
$token,
                    
$token,
                    
"",
                    
$line,
                );
                
$i++;
            } elseif (
$token[0] === T_WHITESPACE) {
                
$tokens[$i 1][2] = $token[1];
            } else {
                
$tokens[] = array(
                    
$token[0],
                    
$token[1],
                    
"",
                    
$line $token[2],
                    
token_name($token[0]) // debug
                
);
                
$i++;
            }

        }
        unset(
$tokens[-1]);
        
$this->tokens   $tokens;
        
$this->_max     count($this->tokens) - 1;
        
$this->_last_no $this->tokens[$this->_max][3];
    }

    
/**
     * Is incomplete mean some string not closed
     *
     * @return int
     */
    
public function isIncomplete()
    {
        return (
$this->quotes 2) || ($this->tokens[$this->_max][0] === T_ENCAPSED_AND_WHITESPACE);
    }

    
/**
     * Return the current element
     *
     * @link http://php.net/manual/en/iterator.current.php
     * @return mixed Can return any type.
     */
    
public function current()
    {
        return 
$this->curr[1];
    }

    
/**
     * Move forward to next element
     *
     * @link http://php.net/manual/en/iterator.next.php
     * @return Tokenizer
     */
    
public function next()
    {
        if (
$this->$this->_max) {
            return 
$this;
        }
        
$this->p++;
        unset(
$this->prev$this->curr$this->next);
        return 
$this;
    }

    
/**
     * Check token type. If token type is one of expected types return true. Otherwise return false
     *
     * @param array $expects
     * @param string|int $token
     * @return bool
     */
    
private function _valid($expects$token)
    {
        foreach (
$expects as $expect) {
            if (
is_string($expect) || $expect 1000) {
                if (
$expect === $token) {
                    return 
true;
                }
            } else {

                if (isset(
self::$macros[$expect][$token])) {
                    return 
true;
                }
            }
        }
        return 
false;
    }

    
/**
     * If the next token is a valid one, move the position of cursor one step forward. Otherwise throws an exception.
     * @param array $tokens
     * @throws UnexpectedTokenException
     * @return mixed
     */
    
public function _next($tokens)
    {
        
$this->next();
        if (!
$this->curr) {
            throw new 
UnexpectedTokenException($this$tokens);
        }
        if (
$tokens) {
            if (
$this->_valid($tokens$this->key())) {
                return;
            }
        } else {
            return;
        }
        throw new 
UnexpectedTokenException($this$tokens);
    }

    
/**
     * Fetch next specified token or throw an exception
     * @return mixed
     */
    
public function getNext/*int|string $token1, int|string $token2, ... */)
    {
        
$this->_next(func_get_args());
        return 
$this->current();
    }

    
/**
     * @param $token
     * @return bool
     */
    
public function isNextToken($token)
    {
        return 
$this->next $this->next[1] == $token false;
    }

    
/**
     * Return token and move pointer
     * @return mixed
     * @throws UnexpectedTokenException
     */
    
public function getAndNext/* $token1, ... */)
    {
        if (
$this->curr) {
            
$cur $this->curr[1];
            
$this->next();
            return 
$cur;
        } else {
            throw new 
UnexpectedTokenException($thisfunc_get_args());
        }
    }

    
/**
     * Check if the next token is one of the specified.
     * @param $token1
     * @return bool
     */
    
public function isNext($token1 /*, ...*/)
    {
        return 
$this->next && $this->_valid(func_get_args(), $this->next[0]);
    }

    
/**
     * Check if the current token is one of the specified.
     * @param $token1
     * @return bool
     */
    
public function is($token1 /*, ...*/)
    {
        return 
$this->curr && $this->_valid(func_get_args(), $this->curr[0]);
    }

    
/**
     * Check if the previous token is one of the specified.
     * @param $token1
     * @return bool
     */
    
public function isPrev($token1 /*, ...*/)
    {
        return 
$this->prev && $this->_valid(func_get_args(), $this->prev[0]);
    }

    
/**
     * Get specified token
     *
     * @param string|int $token1
     * @throws UnexpectedTokenException
     * @return mixed
     */
    
public function get($token1 /*, $token2 ...*/)
    {
        if (
$this->curr && $this->_valid(func_get_args(), $this->curr[0])) {
            return 
$this->curr[1];
        } else {
            throw new 
UnexpectedTokenException($thisfunc_get_args());
        }
    }

    
/**
     * Step back
     * @return Tokenizer
     */
    
public function back()
    {
        if (
$this->=== 0) {
            return 
$this;
        }
        
$this->p--;
        unset(
$this->prev$this->curr$this->next);
        return 
$this;
    }

    
/**
     * @param $token1
     * @return bool
     */
    
public function hasBackList($token1 /*, $token2 ...*/)
    {
        
$tokens func_get_args();
        
$c      $this->p;
        foreach (
$tokens as $token) {
            
$c--;
            if (
$c || $this->tokens[$c][0] !== $token) {
                return 
false;
            }
        }
        return 
true;
    }

    
/**
     * Lazy load properties
     *
     * @param string $key
     * @return mixed
     */
    
public function __get($key)
    {
        switch (
$key) {
            case 
'curr':
                return 
$this->curr = ($this-><= $this->_max) ? $this->tokens[$this->p] : null;
            case 
'next':
                return 
$this->next = ($this-><= $this->_max) ? $this->tokens[$this->1] : null;
            case 
'prev':
                return 
$this->prev $this->$this->tokens[$this->1] : null;
            default:
                return 
$this->$key null;
        }
    }

    public function 
count()
    {
        return 
$this->_max;
    }

    
/**
     * Return the key of the current element
     * @return mixed scalar on success, or null on failure.
     */
    
public function key()
    {
        return 
$this->curr $this->curr[0] : null;
    }

    
/**
     * Checks if current position is valid
     * @return boolean The return value will be casted to boolean and then evaluated.
     *       Returns true on success or false on failure.
     */
    
public function valid()
    {
        return (bool)
$this->curr;
    }

    
/**
     * Get token name
     * @static
     * @param int|string $token
     * @return string
     */
    
public static function getName($token)
    {
        if (
is_string($token)) {
            return 
$token;
        } elseif (
is_integer($token)) {
            return 
token_name($token);
        } elseif (
is_array($token)) {
            return 
token_name($token[0]);
        } else {
            return 
null;
        }
    }

    
/**
     * Skip specific token or throw an exception
     *
     * @throws UnexpectedTokenException
     * @return Tokenizer
     */
    
public function skip/*$token1, $token2, ...*/)
    {
        if (
func_num_args()) {
            if (
$this->_valid(func_get_args(), $this->curr[0])) {
                
$this->next();
                return 
$this;
            } else {
                throw new 
UnexpectedTokenException($thisfunc_get_args());
            }
        } else {
            
$this->next();
            return 
$this;
        }
    }

    
/**
     * Skip specific token or do nothing
     *
     * @param int|string $token1
     * @return Tokenizer
     */
    
public function skipIf($token1 /*, $token2, ...*/)
    {
        if (
$this->_valid(func_get_args(), $this->curr[0])) {
            
$this->next();
        }
        return 
$this;
    }

    
/**
     * Check current token's type
     *
     * @param int|string $token1
     * @return Tokenizer
     * @throws UnexpectedTokenException
     */
    
public function need($token1 /*, $token2, ...*/)
    {
        if (
$this->_valid(func_get_args(), $this->curr[0])) {
            return 
$this;
        } else {
            throw new 
UnexpectedTokenException($thisfunc_get_args());
        }
    }

    
/**
     * Get tokens near current position
     * @param int $before count tokens before current token
     * @param int $after count tokens after current token
     * @return array
     */
    
public function getSnippet($before 0$after 0)
    {
        
$from 0;
        
$to   $this->p;
        if (
$before 0) {
            if (
$before $this->p) {
                
$from $this->p;
            } else {
                
$from $before;
            }
        } elseif (
$before 0) {
            
$from $this->$before;
            if (
$from 0) {
                
$from 0;
            }
        }
        if (
$after 0) {
            
$to $this->$after;
            if (
$to $this->_max) {
                
$to $this->_max;
            }
        } elseif (
$after 0) {
            
$to $this->_max $after;
            if (
$to $this->p) {
                
$to $this->p;
            }
        } elseif (
$this->$this->_max) {
            
$to $this->_max;
        }
        
$code = array();
        for (
$i $from$i <= $to$i++) {
            
$code[] = $this->tokens[$i];
        }

        return 
$code;
    }

    
/**
     * Return snippet as string
     * @param int $before
     * @param int $after
     * @return string
     */
    
public function getSnippetAsString($before 0$after 0)
    {
        
$str "";
        foreach (
$this->getSnippet($before$after) as $token) {
            
$str .= $token[1] . $token[2];
        }
        return 
trim(str_replace("n"'↵'$str));
    }

    
/**
     * Check if current is special value: true, TRUE, false, FALSE, null, NULL
     * @return bool
     */
    
public function isSpecialVal()
    {
        return isset(
self::$spec[$this->current()]);
    }

    
/**
     * Check if the token is last
     * @return bool
     */
    
public function isLast()
    {
        return 
$this->=== $this->_max;
    }

    
/**
     * Move pointer to the end
     */
    
public function end()
    {
        
$this->$this->_max;
        unset(
$this->prev$this->curr$this->next);
        return 
$this;
    }

    
/**
     * Return line number of the current token
     * @return mixed
     */
    
public function getLine()
    {
        return 
$this->curr $this->curr[3] : $this->_last_no;
    }

    
/**
     * Is current token whitespaced, means previous token has whitespace characters
     * @return bool
     */
    
public function isWhiteSpaced()
    {
        return 
$this->prev ? (bool)$this->prev[2] : false;
    }

    public function 
getWhitespace()
    {
        return 
$this->curr $this->curr[2] : false;
    }

    
/**
     * Seek to custom element
     * @param int $p
     * @return $this
     */
    
public function seek($p)
    {
        
$this->$p;
        unset(
$this->prev$this->curr$this->next);
        return 
$this;
    }
}
Онлайн: 2
Реклама