You have an array of directories (straightforward list of directories):
<?php
$array = array(
'/home/drapeko/var',
'/home/drapeko/var/y',
'/home/drapeko',
'/home',
'/var/libexec'
);
);
?>
And you would like to transform this array to hierarchy of directories:
<?php
$array = array (
'home' => array (
'drapeko' => array (
'var' => array (
'y' => array()
)
)
),
'var' => array(
'libexec' => array()
)
);
?>
How can you do it?
First of all the below function will help us.
<?php
/**
* This function converts real filesystem path to the string array representation.
*
* for example,
* '/home/drapeko/var/y will be converted to $result_array['home']['drapeko']['var']['y']
* '/home/drapeko/var/y/file.txt will be converted to $result_array['home']['drapeko']['var']['y']
*
* @param $path realpath of the directory
* @return string string array representation of the path
*/
function pathToArrayStr($path) {
// TODO constants/configs?
$res_path = str_replace(array(':/', ':\\', '/', '\\', DIRECTORY_SEPARATOR), '/', $path);
// if the first or last symbol is '/' delete it (e.g. for linux)
$res_path = preg_replace(array("/^\//", "/\/$/"), '', $res_path);
// create string
$res_path = '[\''.str_replace('/', '\'][\'', $res_path).'\']';
return $res_path;
}
?>
It simply converts the real path of the file to array string representation.
How can you use this function? I know it looks like a little confusing. But it's quite simple. Consider the example below:
<?php
$result = array();
$check = array();
foreach($array as $val) {
$str = pathToArrayStr($val, 'result');
foreach($check as $ck) {
if (strpos($ck, $str) !== false) {
continue 2;
}
}
$check[] = $str;
eval('$result'.$str.' = array();');
}
print_r($result);
?>
Heh, how do you find it? This approach has helped me very much. I hope you will find it useful. :)
XL. ファイルシステム関数
要件
この拡張モジュールを構築するには外部ライブラリを必要としませんが、 Linux 上で LFS (ラージファイル) をサポートする PHP を希望する場合は、 最新の glibc を入手し、次のコンパイラフラグ -D_LARGEFILE_SOURCE -D_FILE_OFFSET_BITS=64 を付けて PHP をコンパイルする必要があります。
インストール手順
PHP コアに含まれるため、 追加のインストール無しで使用できます。
実行時設定
php.ini の設定により動作が変化します。
表 1. ファイルシステムおよびストリーム設定オプション
| 名前 | デフォルト | 変更の可否 | 変更履歴 |
|---|---|---|---|
| allow_url_fopen | "1" | PHP_INI_SYSTEM | PHP_INI_ALL は PHP <= 4.3.4 で利用可能です。 PHP 4.0.4 から利用可能です。 |
| user_agent | NULL | PHP_INI_ALL | PHP 4.3.0 から利用可能です。 |
| default_socket_timeout | "60" | PHP_INI_ALL | PHP 4.3.0 から利用可能です。 |
| from | "" | PHP_INI_ALL | |
| auto_detect_line_endings | "0" | PHP_INI_ALL | PHP 4.3.0 から利用可能です。 |
以下に設定ディレクティブに関する 簡単な説明を示します。
- allow_url_fopen boolean
このオプションにより、URL対応のfopenラッパーが使用可能となり、 ファイルのようにURLオブジェクトをアクセスできるようになります。 デフォルトのラッパーが、ftpまたはhttpプロトコルを用いて リモートファイルに アクセスするために提供されています。zlibのようないくつかの拡張モジュールが ラッパーを追加することがあります。
注意: この設定はセキュリティ上の理由で php.ini 中でのみ設定可能です。
注意: このオプションは、バージョン4.0.3のリリース直後に追加されました。 4.0.3を含む以前のバージョンでは、この機能は、設定スイッチ --disable-url-fopen-wrapperを使用することに より、コンパイル時にのみ無効にすることができます。
警告 PHP 4.3より前のWindows版では、以下の関数は、リモートファイルの アクセスをサポートしません。: include(), include_once(), require(), require_once(), 参照LXII, イメージ関数(image) 拡張モジュールの imagecreatefromXXX
- user_agent string
送信する PHP 用のユーザエージェントを定義します。
- default_socket_timeout integer
ソケットベースのストリームのデフォルトの有効時間(単位は秒)を定義します。
注意: この設定は、PHP 4.3で追加されました。
- from string
匿名ftp用パスワード(自分のemailアドレス)を定義します。
- auto_detect_line_endings boolean
onにした場合、PHPは fgets() および file() により読み込まれたデータを評価し、UNIX、MS-DOS、Machintoshの行末 表記を使用しているかどうかを調べます。
これにより、PHPがMacintoshシステムと相互運用できるようになりますが、 デフォルトはOffとなっています。これは、最初の行の行末表記を検出 する際にごく僅かな性能劣化があるためと、UNIXシステムのもとで復改 文字を項目セパレータとして使用している人が従来のバージョンと互換 性がない動作であると感じる可能性があるためです。
注意: この設定オプションは、PHP 4.3で追加されました。
定義済み定数
以下の定数が定義されています。 この関数の拡張モジュールが PHP 組み込みでコンパイルされているか、 実行時に動的にロードされている場合のみ使用可能です。
- GLOB_BRACE (integer)
- GLOB_ONLYDIR (integer)
- GLOB_MARK (integer)
- GLOB_NOSORT (integer)
- GLOB_NOCHECK (integer)
- GLOB_NOESCAPE (integer)
- PATHINFO_DIRNAME (integer)
- PATHINFO_BASENAME (integer)
- PATHINFO_EXTENSION (integer)
- PATHINFO_FILENAME (integer)
PHP 5.2.0 以降。
- FILE_USE_INCLUDE_PATH (integer)
- FILE_APPEND (integer)
- FILE_IGNORE_NEW_LINES (integer)
- FILE_SKIP_EMPTY_LINES (integer)
- 目次
- basename -- パス中のファイル名の部分を返す
- chgrp -- ファイルのグループを変更する
- chmod -- ファイルのモードを変更する
- chown -- ファイルの所有者を変更する
- clearstatcache -- ファイルのステータスのキャッシュをクリアする
- copy -- ファイルをコピーする
- delete -- unlink() か unset() を参照してください
- dirname -- パス中のディレクトリ名の部分を返す
- disk_free_space -- ディレクトリの利用可能なスペースを返す
- disk_total_space -- ディレクトリの全体サイズを返す
- diskfreespace -- disk_free_space() のエイリアス
- fclose -- オープンされたファイルポインタをクローズする
- feof -- ファイルポインタがファイル終端に達しているかどうか調べる
- fflush -- 出力をファイルにフラッシュする
- fgetc -- ファイルポインタから1文字取り出す
- fgetcsv -- ファイルポインタから行を取得し、CSVフィールドを処理する
- fgets -- ファイルポインタから 1 行取得する
- fgetss -- ファイルポインタから1行取り出し、HTMLタグを取り除く
- file_exists -- ファイルまたはディレクトリが存在するかどうか調べる
- file_get_contents -- ファイルの内容を全て文字列に読み込む
- file_put_contents -- 文字列をファイルに書き込む
- file -- ファイル全体を読み込んで配列に格納する
- fileatime -- ファイルの最終アクセス時刻を取得する
- filectime -- ファイルのinode変更時刻を取得する
- filegroup -- ファイルのグループを取得する
- fileinode -- ファイルのinodeを取得する
- filemtime -- ファイルの更新時刻を取得する
- fileowner -- ファイルの所有者を取得する
- fileperms -- ファイルの許可属性を取得する
- filesize -- ファイルのサイズを取得する
- filetype -- ファイルタイプを取得する
- flock -- 汎用のファイルロックを行う
- fnmatch -- ファイル名がパターンにマッチするか調べる
- fopen -- ファイルまたはURLをオープンする
- fpassthru -- ファイルポインタ上に残っているすべてのデータを出力する
- fputcsv -- 行を CSV 形式にフォーマットし、ファイルポインタに書き込む
- fputs -- fwrite() のエイリアス
- fread -- バイナリ・モードでファイルを読み込む
- fscanf -- フォーマットに基づきファイルからの入力を処理する
- fseek -- ファイルポインタを移動する
- fstat -- オープンしたファイルポインタからファイルに関する情報を得ます
- ftell -- ファイルポインタから読み書きの位置を取得する
- ftruncate -- ファイルを指定した長さに丸める
- fwrite -- バイナリ・モードによるファイル書き込み
- glob -- パターンにマッチするパス名を探す
- is_dir -- ファイルがディレクトリかどうかを調べる
- is_executable -- ファイルが実行可能かどうかを調べる
- is_file -- 通常ファイルかどうかを調べる
- is_link -- ファイルがシンボリックリンクかどうかを調べる
- is_readable -- ファイルが読み込み可能かどうかを知る
- is_uploaded_file -- HTTP POSTによりアップロードされたファイルかどうかを調べる
- is_writable -- ファイルが書き込み可能かどうかを調べる
- is_writeable -- is_writable() のエイリアス
- lchgrp -- シンボリックリンクのグループ所有権を変更する
- lchown -- シンボリックリンクの所有者を変更する
- link -- ハードリンクを作成する
- linkinfo -- リンクに関する情報を取得する
- lstat -- ファイルまたはシンボリックリンクに関する情報を与えます
- mkdir -- ディレクトリを作る
- move_uploaded_file -- 新しい位置にアップロードされたファイルを移動する
- parse_ini_file -- 設定ファイルをパースする
- pathinfo -- ファイルパスに関する情報を返す
- pclose -- プロセスのファイルポインタをクローズする
- popen -- プロセスへのファイルポインタをオープンする
- readfile -- ファイルを出力する
- readlink -- シンボリックリンク先を返す
- realpath -- 絶対パス名を返す
- rename -- ファイルをリネームする
- rewind -- ファイルポインタの位置を先頭に戻す
- rmdir -- ディレクトリを削除する
- set_file_buffer -- stream_set_write_buffer() のエイリアス
- stat -- ファイルに関する情報を取得する
- symlink -- シンボリックリンクを作成する
- tempnam -- ユニークなファイル名を生成する
- tmpfile -- テンポラリファイルを作成する
- touch -- ファイルの最終アクセス時刻および最終更新日をセットする
- umask -- 現在のumaskを変更する
- unlink -- ファイルを削除する
I just learned that, to specify file names in a portable manner, you DON'T need 'DIRECTORY_SEPARATOR' - just use '/'. This really surprised and shocked me, as until now I typed about a zillion times 'DIRECTORY_SEPARATOR' to stay platform independent - unnecessary. Don't make the same mistake.
I made this function to search and/or display files by extension or for a string occurance in the filename. Any comments or enhancements are welcome offcourse. I'll update this function soon.
usage: list_files([string], [string], [int 1 | 0], [int 1 | 0]);
search for extension: list_files([string], [string], [0], [int 1 | 0]);
returns array: $myArray = list_files([string], [string], [0], [0]);
echo result: list_files([string], [string], [0], [1]);
search for string occurance: list_files([string], [string], [1], [int 1 | 0]);
returns array: $myArray = list_files([string], [string], [1], [0]);
echo result: list_files([string], [string], [1], [1]);
<?php
function list_files($directory, $stringSearch, $searchHandler, $outputHandler) {
$errorHandler = false;
$result = array();
if (! $directoryHandler = @opendir ($directory)) {
echo ("<pre>\nerror: directory \"$directory\" doesn't exist!\n</pre>\n");
return $errorHandler = true;
}
if ($searchHandler === 0) {
while (false !== ($fileName = @readdir ($directoryHandler))) {
if(@substr ($fileName, - @strlen ($stringSearch)) === $stringSearch) {
@array_push ($result, $fileName);
}
}
}
if ($searchHandler === 1) {
while(false !== ($fileName = @readdir ($directoryHandler))) {
if(@substr_count ($fileName, $stringSearch) > 0) {
@array_push ($result, $fileName);
}
}
}
if (($errorHandler === true) && (@count ($result) === 0)) {
echo ("<pre>\nerror: no filetype \"$fileExtension\" found!\n</pre>\n");
}
else {
sort ($result);
if ($outputHandler === 0) {
return $result;
}
if ($outputHandler === 1) {
echo ("<pre>\n");
print_r ($result);
echo ("</pre>\n");
}
}
}
?>
Here is a function I wrote to get the relative path between 2 files or directory.
We suppose that paths are wrotten in Unix format (/ instead of windows \\)
<?php
/**
* Return the relative path between two paths / Retourne le chemin relatif entre 2 chemins
*
* If $path2 is empty, get the current directory (getcwd).
* @return string
*/
function relativePath($path1, $path2='')
{
if ($path2 == '') {
$path2 = $path1;
$path1 = getcwd();
}
//Remove starting, ending, and double / in paths
$path1 = trim($path1,'/');
$path2 = trim($path2,'/');
while (substr_count($path1, '//')) $path1 = str_replace('//', '/', $path1);
while (substr_count($path2, '//')) $path2 = str_replace('//', '/', $path2);
//create arrays
$arr1 = explode('/', $path1);
if ($arr1 == array('')) $arr1 = array();
$arr2 = explode('/', $path2);
if ($arr2 == array('')) $arr2 = array();
$size1 = count($arr1);
$size2 = count($arr2);
//now the hard part :-p
$path='';
for($i=0; $i<min($size1,$size2); $i++)
{
if ($arr1[$i] == $arr2[$i]) continue;
else $path = '../'.$path.$arr2[$i].'/';
}
if ($size1 > $size2)
for ($i = $size2; $i < $size1; $i++)
$path = '../'.$path;
else if ($size2 > $size1)
for ($i = $size1; $i < $size2; $i++)
$path .= $arr2[$i].'/';
return $path;
}
?>
Enjoy ! :-)
This function searches a directory and returns an array of all files whose filename matches the specified regular expression. It's similar in concept to the Unix find program.
function findfile($location='',$fileregex='') {
if (!$location or !is_dir($location) or !$fileregex) {
return false;
}
$matchedfiles = array();
$all = opendir($location);
while ($file = readdir($all)) {
if (is_dir($location.'/'.$file) and $file <> ".." and $file <> ".") {
$subdir_matches = findfile($location.'/'.$file,$fileregex);
$matchedfiles = array_merge($matchedfiles,$subdir_matches);
unset($file);
}
elseif (!is_dir($location.'/'.$file)) {
if (preg_match($fileregex,$file)) {
array_push($matchedfiles,$location.'/'.$file);
}
}
}
closedir($all);
unset($all);
return $matchedfiles;
}
$htmlfiles = findfile('/some/dir','/\.(htm|html)$/');
I needed a function to find disk usage for a directory and its subs, so here it is. It's kinda like the Unix du program, except it returns the usage in bytes, not blocks.
function du($location) {
if (!$location or !is_dir($location)) {
return 0;
}
$total = 0;
$all = opendir($location);
while ($file = readdir($all)) {
if (is_dir($location.'/'.$file) and $file <> ".." and $file <> ".") {
$total += du($location.'/'.$file);
unset($file);
}
elseif (!is_dir($location.'/'.$file)) {
$stats = stat($location.'/'.$file);
$total += $stats['size'];
unset($file);
}
}
closedir($all);
unset($all);
return $total;
}
print du('/some/directory');
In the code samples of the user-contributed notes, you'll find functions that sometimes need a slash at the end of a folder path and sometimes don't.
Here's a little function to append a slash at the end of a path if there isn't one already.
function append_slash_if_none($string)
{
if (ereg ("/$", $string))
{
return $string;
}
else
{
return ereg_replace("$", "/", $string);
}
}
(Replace with a backslash if you're on Windows...)
Pollard@php.net contributed this in response to a question on setting these variables ...
This option *IS* settable within your PHP scripts.
Example:
<?php
ini_set('auto_detect_line_endings', true);
$contents = file('unknowntype.txt');
ini_set('auto_detect_line_endings', false);
$content2 = file('unixfile.txt');
?>
Note, with PHP 4.3 anytime Mac files are read using fgets or file you'll need to auto_detect_line_endings since \n is otherwise assumed. However, with PHP 5.0, stream_get_line() will allow you to specify what line ending character to read up to.
\\ Read a line from a MAC file
stream_get_line($fp, 4096, "\r");
\\ Read a line from a UNIX file
stream_get_line($fp, 4096, "\n");
\\ Read a line from a DOS file
stream_get_line($fp, 4096, "\r\n");
\\ Read a line up to any filesystem line ending
ini_set('auto_detect_line_endings', true); fgets($fp);
\\ You can also make up your own line ending characters:
\\ Read up to the first instance of ":"
stream_get_line($fp, 4096, ":");
Here is a useful function if you're having trouble writing raw bytes into a file.
It receives an integer and returns an array containing the ASCII values of the bytes on each index of the array.
function int2bytes($number){
$byte = $number;
$i=0;
do{
$dec_tmp = $byte;
$byte = bcdiv($byte,256,0);
$resto = $dec_tmp - (256 * $byte);
$return[] = $resto;
} while($byte >= 256);
if($byte) $return[] = $byte;
return array_reverse($return);
}
Example:
$arr = int2bytes(75832);
$arr will contain the following values:
Array
(
[0] => 1
[1] => 40
[2] => 56
)
Now, to write this data to the file, just use a fputs() with chr(), just like this:
fputs($fp,chr($arr[0]).chr($arr[1]).chr($arr[2]))
-- Regis
This is a function I use to determine if a file contains Binary information. I use this for my search engine so that it doesn't try to index files like .zip or .mp3 or any other file that doesn't contain readable information. It makes use of the Character Type Extension if it's loaded, if it's not then it uses Regular Expressions.
function is_binary($link)
{
$tmpStr = '';
@$fp = fopen($link, 'rb');
@$tmpStr = fread($fp, 256);
@fclose($fp);
if($tmpStr != '')
{
$tmpStr = str_replace(chr(10), '', $tmpStr);
$tmpStr = str_replace(chr(13), '', $tmpStr);
$tmpInt = 0;
for($i =0; $i < strlen($tmpStr); $i++)
{
if( extension_loaded('ctype') )
{
if( !ctype_print($tmpStr[$i]) )
$tmpInt++;
}
else
{
if( !eregi("[[:print:]]+", $tmpStr[$i]) )
$tmpInt++;
}
}
if($tmpInt > 5)
return(0);
else
return(1);
}
else
return(0);
}
