澳门新葡萄京娱乐场php bcd码压缩-把十进制数字压缩到十六进制数据中

还记得以前在工作中,将爬来的其它网站的数据导到xml。但是会遇到一个问题:即网页会有ascII的控制字符。一开始以为是别人为了防止采集而加入的,然后发现一个就往过滤表里加一个。直到慢慢发现,他们都是ascii表里的字符。找到原因了,就好解决了。

例,php bcd码压缩-把十进制数字压缩到十六进制数据中

复制代码 代码如下:
/**
 * 根据ascii码过滤控制字符
 * @param type $string
 */
public static function special_filter($string)
{
 if(!$string) return ”;

 代码如下

 $new_string = ”;
 for($i =0; isset($string[$i]); $i++)
 {
  $asc_code = ord($string[$i]);    //得到其asc码

<?php
/*
php bcd码压缩-把十进制数字压缩到十六进制数据中
例如 0091 压缩后 0x00 0x91
*/
$string = ‘0091’;
$bytes = Bytes::getBytes($string);
print_r($bytes);
/*
Array
(
   
[0] => 48
   
[1] => 48
   
[2] => 57
   
[3] => 49
)
*/
$asc=Bytes::AscToHex($bytes,4);
//4位压缩成2位
print_r($asc);
/*
Array
(
   
[0] => 0
   
[1] => 145
)
*/
echo Bytes::toStr($asc);
/*
0091
*/
$hex=Bytes::HexToAsc($asc,2);
//反操作2位还原成4位
print_r($hex);
/*
Array
(
   
[0] => 48
   
[1] => 48
   
[2] => 57
   
[3] => 49
)
*/
?>

  //以下代码旨在过滤非法字符
  if($asc_code == 9 || $asc_code == 10 || $asc_code == 13){
   $new_string .= ‘ ‘;
  }
  else if($asc_code > 31 && $asc_code != 127){
   $new_string .= $string[$i];
  }
 }

例,把十进制数字压缩到十六进制数据中

 return trim($new_string);
}

 代码如下

<?php
/**
 
* php bcd码压缩
 
* 把十进制数字压缩到十六进制数据中
 
* @author phpff.com
 
* Created on 2011-7-15
 
*/
class Bytes {
   
/**
    
* 转换一个String字符串为byte数组
    
* @param $str 需要转换的字符串
    
* @param $bytes 目标byte数组
    
* @author phpff.com
    
*/
    public static function getBytes($string) {
 
        $bytes = array();
        for($i = 0; $i < strlen($string); $i++){
             $bytes[] = ord($string[$i]);
        }
        return $bytes;
    }
 
   
/**
    
* 将字节数组转化为String类型的数据
    
* @param $bytes 字节数组
    
* @param $str 目标字符串
    
* @return 一个String类型的数据
    
*/
 
    public static function toStr($bytes) {
        $str = ”;
        foreach($bytes as $ch)
{
            $str .= bin2hex(chr($ch));
        }
 
           return $str;
    }
 
   
/**
    
* asc码转成16进制数据
    
* @param $asc asc数字字符串
    
* @param $AscLen 需要转换的字符串长度
    
* @return 16进制数组
    
* @author  phpff.com
    
*/
     public static function AscToHex( $asc, $AscLen) {
        $i=0;
        $Hex=array();
        for($i = 0; 2*$i < $AscLen; $i++)
        {
           
/*A:0x41(0100 0001),a:0x61(0110
0001),右移4位后都是0001,加0x90等0xa*/
            $Hex[$i] =  (chr($asc[2*$i]) << 4);
            if (!(chr($asc[2*$i]) >= ‘0’ && chr($asc[2*$i])
<= ‘9’ )){
                $Hex[$i] +=  0x90;
            }
 
            if(2*$i+1 >= $AscLen){
                break;
            }
 
            $Hex[$i] |= (chr($asc[2*$i+1]) & 0x0f);
            if (!(chr($asc[2*$i+1]) >= ‘0’ && chr($asc[2*$i+1])
<= ‘9’ )){
                $Hex[$i] += 0x09;
            }
 
        }
        return $Hex;
    }
    
/**
    
* 将16进制的数据转换成asc码
    
* @param $Hex 16进制数组
    
* @param $HexLen 16进制数组长度
    
* @return asc数组
    
* @author  phpff.com
    
*/
    public static function HexToAsc($Hex, $HexLen) {
        $i=0;
        $Temp=0;
        for($i = 0; $i < $HexLen; $i++ )
        {
            $Temp = ($Hex[$i] & 0xf0) >> 4;
            if ($Temp < 10){
                $Asc[2*$i] =  (0x30 + $Temp);
            }else{
                $Asc[2*$i] =   (0x37 + $Temp);
            }
 
            $Temp = $Hex[$i] & 0x0f;
            if ($Temp < 10){
                $Asc[2*$i+1] = (0x30 + $Temp);
            }else{
                $Asc[2*$i+1] =  (0x37 + $Temp);
            }
 
        }
        return $Asc;
    }
 
}
?>

发表评论

电子邮件地址不会被公开。 必填项已用*标注