Initial commit
This commit is contained in:
@@ -0,0 +1,114 @@
|
||||
<?php
|
||||
|
||||
/*****************************************************************
|
||||
Пример использования:
|
||||
|
||||
RemoteFile::setHeaders(array(
|
||||
'X-Requested-With: XMLHttpRequest',
|
||||
'Origin: http://vkontakte.ru',
|
||||
'Content-Type: application/x-www-form-urlencoded'
|
||||
));
|
||||
$headers = RemoteFile::getHeaders('http://cs4603.vkontakte.ru/u50132690/audio/432e2b109b94.mp3');
|
||||
$html = RemoteFile::getData('http://vkontakte.ru/audio', array(
|
||||
'act' =>'search',
|
||||
'q' => urlencode($this->_query)
|
||||
))
|
||||
*****************************************************************/
|
||||
|
||||
/**
|
||||
* Класс для работы с удаленными файлами
|
||||
* Реализован через библиотеку cURL
|
||||
*
|
||||
* @package classes
|
||||
* @author chez
|
||||
**/
|
||||
class RemoteFile {
|
||||
|
||||
private static $_timeout = 5; // Таймаут ответа от сервера
|
||||
private static $_headers = array(); // Заголовки для отправки на сервер
|
||||
|
||||
/**
|
||||
* Отправка запроса и получение ответа от сервера
|
||||
* Умеет возвращать текст ответа или заголовки
|
||||
*
|
||||
* @param string $url URL запроса
|
||||
* @param bool $headers Флаг: возвращать заголовки, а не текст
|
||||
* @param array $post_params Массив POST-параметров, если установлен, то метод меняется на POST
|
||||
* @return string Ответ от сервера
|
||||
* @author chez
|
||||
**/
|
||||
private static function _exec($url, $headers = false, $post_params = array()) {
|
||||
if (count($post_params) > 0) {
|
||||
$p = '';
|
||||
foreach ($post_params as $key => $val) {
|
||||
$p .= '&'. $key .'='. $val;
|
||||
}
|
||||
$post_params = substr($p, 1);
|
||||
}
|
||||
$ch = curl_init();
|
||||
curl_setopt($ch, CURLOPT_URL, $url);
|
||||
curl_setopt($ch, CURLOPT_HTTPHEADER, self::$_headers);
|
||||
if ($headers) {
|
||||
curl_setopt($ch, CURLOPT_HEADER, 1);
|
||||
curl_setopt($ch, CURLOPT_NOBODY, 1);
|
||||
}
|
||||
if (is_string($post_params)) {
|
||||
curl_setopt($ch, CURLOPT_POST, 1);
|
||||
curl_setopt($ch, CURLOPT_POSTFIELDS, $post_params);
|
||||
}
|
||||
curl_setopt($ch, CURLOPT_VERBOSE, 1);
|
||||
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
|
||||
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, self::$_timeout);
|
||||
$r = curl_exec($ch);
|
||||
curl_close($ch);
|
||||
return $r;
|
||||
}
|
||||
|
||||
/**
|
||||
* Получение HTTP-заголовков ответа от сервера
|
||||
*
|
||||
* @param string $url URL запроса
|
||||
* @param array $post_params Массив POST-параметров, если установлен, то метод меняется на POST
|
||||
* @return array Распарсеный массив заголовков
|
||||
* @author chez
|
||||
**/
|
||||
public static function getHeaders($url, $post_params = array()) {
|
||||
$headers = explode("\r\n", self::_exec($url, true));
|
||||
$headers_array = array();
|
||||
|
||||
while(list($i, $header) = each($headers)) {
|
||||
if (substr($header, 0, 5) == 'HTTP/') {
|
||||
$header = explode(' ', $header);
|
||||
$headers_array['http'] = $header[1];
|
||||
} elseif ($header != '') {
|
||||
preg_match('/^([a-z0-9\-]*):\s(.*)$/Ui', $header, $m);
|
||||
$headers_array[strtolower(str_replace('-', '_', $m[1]))] = $m[2];
|
||||
}
|
||||
}
|
||||
|
||||
return $headers_array;
|
||||
}
|
||||
|
||||
/**
|
||||
* Получение ответа от сервера
|
||||
*
|
||||
* @param string $url URL запроса
|
||||
* @param array $post_params Массив POST-параметров, если установлен, то метод меняется на POST
|
||||
* @return string Тело ответа от сервера
|
||||
* @author chez
|
||||
**/
|
||||
public static function getData($url, $post_params = array()) {
|
||||
return self::_exec($url, false, $post_params);
|
||||
}
|
||||
|
||||
/**
|
||||
* Запись заголовков, которые будет отправлены вместе с запросом
|
||||
*
|
||||
* @param array $headers Индексный массив заголовков
|
||||
* @return void
|
||||
* @author chez
|
||||
**/
|
||||
public static function setHeaders($headers) {
|
||||
self::$_headers = $headers;
|
||||
}
|
||||
}
|
||||
@@ -0,0 +1,99 @@
|
||||
<?php
|
||||
|
||||
/*****************************************************************
|
||||
Пример использования:
|
||||
|
||||
$weight_calc = new TrackWeight();
|
||||
$weight_calc->setTrackData('Blondie', 'Call Me', 210);
|
||||
$weight_calc->setFiles($files); // Файлы, полученные от парсера
|
||||
$weight_calc->calculateWeight();
|
||||
$files = $weight_calc->getFiles();
|
||||
*****************************************************************/
|
||||
|
||||
/**
|
||||
* Класс посчета веса файла (коэфициента, определяющего релевантность)
|
||||
*
|
||||
* @package classes
|
||||
* @author chez
|
||||
**/
|
||||
class TrackWeight {
|
||||
|
||||
private $_artist; // Имя исполнителя
|
||||
private $_track; // Название трека
|
||||
private $_duration; // Длительность трека в секундах
|
||||
|
||||
private $_files; // Массив файлов для сравнения
|
||||
|
||||
/**
|
||||
* Задает параметры оригинального трека
|
||||
*
|
||||
* @param string $artist Имя исполнителя
|
||||
* @param string $track Запрос
|
||||
* @param int $duration Длительность трека в секундах
|
||||
* @return void
|
||||
* @author chez
|
||||
**/
|
||||
public function setTrackData($artist, $track, $duration) {
|
||||
$this->_artist = $artist;
|
||||
$this->_track = $track;
|
||||
$this->_duration = $duration;
|
||||
}
|
||||
|
||||
/**
|
||||
* Задает массив файлов для сравнения
|
||||
*
|
||||
* @param array $files Массив файлов для сравнения
|
||||
* @return void
|
||||
* @author chez
|
||||
**/
|
||||
public function setFiles($files) {
|
||||
$this->_files = $files;
|
||||
}
|
||||
|
||||
/**
|
||||
* Возвращает файлы с проставленным весом
|
||||
*
|
||||
* @return array $files Массив файлов
|
||||
* @author chez
|
||||
**/
|
||||
public function getFiles() {
|
||||
return $this->_files;
|
||||
}
|
||||
|
||||
/**
|
||||
* Рассчитывает вес для каждого файла
|
||||
*
|
||||
* @return void
|
||||
* @author chez
|
||||
**/
|
||||
public function calculateWeight() {
|
||||
foreach ($this->_files as $i => $file) {
|
||||
$weight = 0;
|
||||
|
||||
if ($file['artist'] == $this->_artist) {
|
||||
$weight += 10;
|
||||
} elseif (strpos($file['artist'], $this->_artist) !== false) {
|
||||
$weight += 5;
|
||||
} elseif (strpos($file['track'], $this->_artist) !== false) {
|
||||
$weight += 4;
|
||||
}
|
||||
|
||||
if ($file['track'] == $this->_track) {
|
||||
$weight += 10;
|
||||
} elseif (strpos($file['track'], $this->_track) !== false) {
|
||||
$weight += 5;
|
||||
}
|
||||
|
||||
if ($file['duration'] == $this->_duration) {
|
||||
$weight += 10;
|
||||
} else {
|
||||
$delta = abs($file['duration'] - $this->_duration);
|
||||
if ($delta < 5) {
|
||||
$weight += (5 - $delta);
|
||||
}
|
||||
}
|
||||
|
||||
$this->_files[$i]['weight'] = $weight;
|
||||
}
|
||||
}
|
||||
}
|
||||
@@ -0,0 +1,108 @@
|
||||
<?php
|
||||
|
||||
/*****************************************************************
|
||||
Пример использования:
|
||||
|
||||
$files = VkontakteMP3::check($files);
|
||||
*****************************************************************/
|
||||
|
||||
/**
|
||||
* Класс для постобработки массива треков от контакта
|
||||
* Проверяет файлы, рассчитывает битрейт и релевантность
|
||||
*
|
||||
* @package classes
|
||||
* @author chez
|
||||
**/
|
||||
class VkontakeMP3 {
|
||||
|
||||
private static $_bitrates = array( // Массив стандартных битрейтов
|
||||
8, 16, 24, 32, 40, 48, 56,
|
||||
64, 80, 96, 112, 128, 144,
|
||||
160, 192, 224, 256, 320
|
||||
);
|
||||
|
||||
/**
|
||||
* Рассчитывает средний битрейт файла
|
||||
* Приводит полученый битрейт к одному из стандартных
|
||||
*
|
||||
* @param int $size Размер файла в байтах
|
||||
* @param int $length Длина трека в секундах
|
||||
* @return int Битрейт в килобитах в секунду
|
||||
* @author chez
|
||||
**/
|
||||
public static function calculateBitrate($size, $length) {
|
||||
$br = round($size * 8 / 1024 / $length);
|
||||
$found_br = 0;
|
||||
for ($i = 1; $i < count(self::$_bitrates); $i++) {
|
||||
if (self::$_bitrates[$i] > $br && ! $found_br) {
|
||||
$delta = self::$_bitrates[$i] - $br;
|
||||
$br_delta = self::$_bitrates[$i] - self::$_bitrates[$i-1];
|
||||
if (round($br_delta / 3) > $delta) {
|
||||
$found_br = self::$_bitrates[$i];
|
||||
} else {
|
||||
$found_br = self::$_bitrates[$i-1];
|
||||
}
|
||||
} elseif ($i == count(self::$_bitrates) - 1 && self::$_bitrates[$i] < $br && ! $found_br) {
|
||||
$delta = $br - self::$_bitrates[$i];
|
||||
if ($delta < 32) {
|
||||
$found_br = self::$_bitrates[$i];
|
||||
} else {
|
||||
$found_br = $br;
|
||||
}
|
||||
}
|
||||
}
|
||||
return $found_br;
|
||||
}
|
||||
|
||||
/**
|
||||
* Проверяет файлы, рассчитывает битрейт и релевантность
|
||||
*
|
||||
* @param array $files Массив файлов для обработки
|
||||
* @return array Обработанный массив файлов
|
||||
* @author chez
|
||||
**/
|
||||
public static function check($files) {
|
||||
|
||||
$m = new Match();
|
||||
$m->setTrackData('Blondie', 'Call Me', 210);
|
||||
$m->setFiles($files);
|
||||
$m->calculateWeight();
|
||||
$files = $m->getFiles();
|
||||
|
||||
uasort($files, function($a, $b){
|
||||
return $a['weight'] < $b['weight'];
|
||||
});
|
||||
|
||||
foreach ($files as $i => $file) {
|
||||
$files[$i]['length'] = self::convertDuration($file['duration']);
|
||||
$files[$i]['bitrate'] = self::calculateBitrate($file['size'], $files[$i]['length']);
|
||||
}
|
||||
return $files;
|
||||
}
|
||||
|
||||
/**
|
||||
* Чистит строку для максимально точного сравнения
|
||||
*
|
||||
* @param string $str Необработанная строка
|
||||
* @return string Чистая строка
|
||||
* @author chez
|
||||
**/
|
||||
public static function prepareQuery($str) {
|
||||
$str = trim($str);
|
||||
while(strpos($str, ' ') !== false) {
|
||||
$str = str_replace(' ', ' ', $str);
|
||||
}
|
||||
return $str;
|
||||
}
|
||||
|
||||
/**
|
||||
* Преобразует длину из формата мм:сс в ссс
|
||||
*
|
||||
* @param string $duration Читабельная длина
|
||||
* @return int Длина в секундах
|
||||
* @author chez
|
||||
**/
|
||||
public static function convertDuration($duration) {
|
||||
|
||||
}
|
||||
}
|
||||
@@ -0,0 +1,127 @@
|
||||
<?php
|
||||
|
||||
/*****************************************************************
|
||||
Пример использования:
|
||||
|
||||
$vk_parser = new Vkontakte();
|
||||
$vk_parser->parse('Blondie - Call Me');
|
||||
$files = $weight_calc->getFiles();
|
||||
*****************************************************************/
|
||||
|
||||
/**
|
||||
* Класс парсинга вконтактика
|
||||
*
|
||||
* @package classes
|
||||
* @author chez
|
||||
**/
|
||||
class Vkontakte {
|
||||
|
||||
private $_cookies; // Куки, ассоциативный массив
|
||||
private $_query; // Запрос, plain text
|
||||
|
||||
private $_html; // HTML, полученый от вконтактика
|
||||
private $_files; // Распарсеные массивы с информацией о файле
|
||||
|
||||
/**
|
||||
* Оболочка парсера
|
||||
*
|
||||
* @param string $q Запрос
|
||||
* @return array Массив с файлами
|
||||
* @author chez
|
||||
**/
|
||||
public function parse($q) {
|
||||
$this->_query = $q;
|
||||
$this->auth();
|
||||
$cookie = array();
|
||||
foreach ($this->_cookies as $key => $val) {
|
||||
$cookie[] = $key .'='. $val;
|
||||
}
|
||||
RemoteFile::setHeaders(array(
|
||||
'Cookie: '. implode('; ', $cookie),
|
||||
'Referer: http://vkontakte.ru/audio?album_id=0',
|
||||
'X-Requested-With: XMLHttpRequest',
|
||||
'Origin: http://vkontakte.ru',
|
||||
'Content-Type: application/x-www-form-urlencoded',
|
||||
'User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_7; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.151 Safari/534.16',
|
||||
'Connection: close'
|
||||
));
|
||||
$this->setHtml(RemoteFile::getData('http://vkontakte.ru/audio', array(
|
||||
'act' =>'search',
|
||||
'al' =>'1',
|
||||
'gid' =>'0',
|
||||
'id' =>'5728795',
|
||||
'offset' =>'0',
|
||||
'q' => urlencode($this->_query),
|
||||
'sort' =>'2'
|
||||
)));
|
||||
$this->parseHtml();
|
||||
return $this->_files;
|
||||
}
|
||||
|
||||
/**
|
||||
* Пишет полученый html в член объекта
|
||||
*
|
||||
* @param string $html HTML
|
||||
* @return void
|
||||
* @author chez
|
||||
**/
|
||||
public function setHtml($html) {
|
||||
$this->_html = $html;
|
||||
}
|
||||
|
||||
/**
|
||||
* Возвращает хранимый html
|
||||
*
|
||||
* @return string HTML
|
||||
* @author chez
|
||||
**/
|
||||
public function getHtml() {
|
||||
return $this->_html;
|
||||
}
|
||||
|
||||
/**
|
||||
* Возвращает хранимый массив файлов
|
||||
*
|
||||
* @return array Список файлов
|
||||
* @author chez
|
||||
**/
|
||||
public function getFiles() {
|
||||
return $this->_files;
|
||||
}
|
||||
|
||||
/**
|
||||
* Проводит авторизацию на вконтактике и получает куки
|
||||
* Пока костыль, потом нужно будет переписать
|
||||
*
|
||||
* @return array Ассоциативный массив с куками
|
||||
* @author chez
|
||||
**/
|
||||
private function auth() {
|
||||
$this->_cookies = array(
|
||||
'remixchk' => 5,
|
||||
'remixsid' => 'c68c4362f62f218a25802bae87201d1bc46fadd0b5c64f71678430c9b63b'
|
||||
);
|
||||
}
|
||||
|
||||
/**
|
||||
* Разбирает HTML, полученый от вконтактика
|
||||
*
|
||||
* @return array Список файлов
|
||||
* @author chez
|
||||
**/
|
||||
public function parseHtml() {
|
||||
preg_match_all('/<tr>(.*)<\/tr>/Usi', $this->_html, $m);
|
||||
$files = array();
|
||||
foreach ($m[0] as $res) {
|
||||
preg_match('/<input.*value=\"(.*)\,(\d{2,4})\".*<div\sclass=\"duration.*>(.*)<\/div>.*<a.*>(.*)<\/a>.*\s-\s(.*)<\/div>/Usi', $res, $m1);
|
||||
$duration = explode(':', $m1[3]);
|
||||
$files[] = array(
|
||||
'url' => $m1[1],
|
||||
'duration' => $duration[0] * 60 + $duration[1],
|
||||
'artist' => strip_tags($m1[4]),
|
||||
'track' => strip_tags($m1[5])
|
||||
);
|
||||
}
|
||||
$this->_files = $files;
|
||||
}
|
||||
}
|
||||
Reference in New Issue
Block a user