Автор: Кирилл Карпенко
21 июня 2006 года
Привет всем читателям!
Сегодня мы рассмотрим довольно важную тему, которая выдвигается многими
работодателями, а именно мультиязычность.
Что же я имел ввиду, говоря о мультиязычности. Ну, наверняка каждый из моих
достопочтенных читателей не раз видели крутые порталы и между всем сбродом
информации находили две маленькие иконки, преимущественно со всем известным
звёздно-полосатым и родным бело-сине-красным флагами. Безусловно, после нажатия
на одну из них привычная нам русская речь превращалась в буржуйский language (),
или наоборот. Но задавали ли вы себе когда-либо вопрос о том, как это всё
делается. Что ж, именно об этом я и буду вести речь.
Сразу скажу, что для работы с тем материалом, который будет здесь изложен вам
понадобиться поддержка РНР не ниже 4.39.
Итак, как вы знаете, содержание нашего сайта разделяется на динамическое и
статическое. К статическому содержанию мы отнесём то, что не будет изменять своё
значение в процессе работы (ключевые слова, текст ошибок, и прочая белиберда). С
этого мы и начнём. Но давайте проанализируем, как именно мы будем изменять язык
данного текстового значения. Надеюсь, никто не предложил воспользоваться
исключениями, ибо это настолько нерационально, что нерациональней и быть не
может. Вместо этого я предлагаю воспользоваться константами (о типе данных
читайте на php.net). Мы просто будем объявлять служебное слово, которое в
зависимости от значения языка соответственно будет менять и своё значение. Как
мы это сделаем? Да как и все, создадим два (к примеру) разных файла, имена
которых будут носить такой шаблон:
Язык_map.php;
Как вы уже поняли вместо слова `язык` мы подставим значение, характеризующее
данный язык. В нашем случае мы будем использовать двухсимвольный код языка (ru,
en, ua, pl и т.д.).
Что ж теорию выяснили теперь давайте, применим наши знания на практике. Создаём
два файла. Я создал файлы с английским переводом и русским, а как создадите вы
это уже на ваш вкус.
Файл: en_map.php
<?
If(!defined("DEF")) {
Define("DEF",true);
Define("TIME_ELAPCED","Time what you can spend in this site was elapced !");
Define("ADMIN_WELCOM","Welcom dear administrator !");
//И хватит
}
?>
Файл: ru_map.php
<?
If(!defined("DEF")) {
Define("DEF",true);
Define("TIME_ELAPCED","Время которое вы можете проводить на сайте истекло !");
Define("ADMIN_WELCOM","Добро пожаловать дорогой администратор !");
}
?>
Итак, на мой взгляд, ничего сложного нет, и всё написанное подчиняется самым
банальным законам РНР. Сначала мы делаем проверку, не были ли константы уже
объявлены, если были, то не объявляем, в противном же случае объявляем.
Это была лёгкая часть, теперь давайте перейдём к более сложной теме - к переводу
динамической части.
Допустим, у вас есть большая портальная система или простой сайт, но вы,
талантливый программист знающий все аспекты РНР, не являетесь его владельцем, а
сделали его под заказ. Владельцем же является полным дизайнером (), который не
слухом, не духом о каких-то там программистских тонкостях, но у него есть одно
лишь желание, чтобы всё работало, и он мог изменять всё. Насчёт всего, это уже
другая история, а вот языковые параметры сайта мы ему всё-таки разрешим изменить
(да что там, чем бы дитя ни тешилось ).
Но опять возвращаясь к дилемме о "Дизайнерах и Программистах" нужно опять
упомянуть что такой сайт должен полностью быть, так сказать "Что Видишь То И
Получишь", иначе нельзя. Поэтому я постараюсь сделать всё так, чтобы оно не
вызывало нервного тика у программистов, и могло удовлетворить дизайнеров
(имеется ввиду юзабилити).
Итак, долой пустые слова и вперёд на Берлин. Мы начнём с теории. Итак, как же мы
будем различать языки у динамического содержания, которое в лучшем случае
удаляется, изменяется, а то и чего хорошего вообще накроется. Константами тут
никак не обойтись, что же делать?
Я уже слышу витающие вокруг вас мысли.
Лично когда я пытался воплотить это в жизнь, то сначала я это сделал самым
нерациональным способом, а именно для перевода статей разделил поля в таблице,
которые подлежали переводу надвое (то есть, создал поле_eng и поле_ru) таким
образом, и так большие по объёму таблицы превратились просто в непристойно
огромные. Поэтому я начал искать альтернативу, и не поверите, нашёл её.
Чувствуете уже теплее, да, скоро мы подойдём к самому горячему. Я нашёл выхода
из этой ситуации, и сейчас намерен объяснить на пальцах его вам, и то поймёте ли
вы его или нет, будет зависеть от вас. Сначала давайте, согласуем все детали.
Для начала нам нужна, будет таблица, в которой будут размещаться данные для
перевода. Скажем у нас есть таблица `articles` в которой будут размещены
некоторые статьи, и они должны иметь, скажем, два перевода, но один обязательно.
Нас будут интересовать лишь два ключевых, в нашем случае, поля: название,
описание. Мы будем осуществлять структурирование текста таким образом:
<%eng%>Английский вариант статьи</%eng%>
<%ru%>Русский вариант статьи</%ru%>
После строка ввиде комбинации из этих двух структур и будет добавляться в поля
`title` и `description` таблицы `articles`.
Данный способ будет заключаться в поиске первого вхождения открывающего
ключевого слова (допустим <%eng%>), после мы найдём первое вхождение
закрывающего ключевого слова. Но нужно не забывать что нам нужно не именно
вхождение, а длина конструкции. В первом случае мы к первому вхождению
открывающей конструкции будем добавлять длину конструкции, вторым шагом будет
нахождение длины закрывающей конструкции. Но вы спросите: <Как же мы получим
текст?>.
Воспользовавшись функцией substr(). В качестве первого параметра будет сам
текст, в качестве второго длина открывающей конструкции, в качестве третьего
(самое интересное) разница между первым вхождением закрывающей конструкции и
длинной текста. Да, понимаю это не так легко, но это нужно понять. Поэтому мы
сейчас это и проделаем на практике. Я создал функцию, которая будет выделять
текст между ключевыми тегами. Она будет принимать три параметра: текст для
разбора, язык по которому нужно проводить парсинг, массив конструкций.
<?
function subTextByLang($data,$lang,
$delimiters=array('<%','%>','<%/','%>')) {
$start_tag=strpos($data,$delimiters[0].$lang.$delimiters[1])+
strlen($delimiters[0].$lang.$delimiters[1]);
$count=(strpos($data,$delimiters[2].$lang.$delimiters[3])-strlen($data))
$data=substr($data,$start_tag,$count);
if(trim($data)==''){
$data=NOT_ENTERED;
}
return $data;
}
?>
Как видите довольно длинно и можно запутаться, но если вы и не поняли этого, то
это не большая беда, ибо функция для перебора уже есть, а чуть дальше я
рассмотрю другой метод для этой же цели. Да, и не забудьте где-нибудь объявить
языковую константу NOT_ENTERED, которая будет присваиваться результату работы
функции в случае, если длина текста равна нулю.
Так, с перебором выяснили, но теперь перед нами предстаёт новая задача,
компиляция обычного текста в спецформатированую строку. Это уже намного проще, и
если вы достаточно хорошо знаете РНР, то вы без труда напишите такую функцию, а
если пока плаваете, то прошу в кабинет .
Алгоритм не сложный и заключён в том, чтобы подставить в все языковые
конструкции в одну строку. Сначала я в порывах лени я хотел ограничить скрипт
определённым числом языков (так его воплотить легче), однако после одумался и
получил вот что:
<?
function compilateLanguageString($data,
$delimiters=array('<%','%>','<%/','%>')) {
if(!is_array($data)) {
die(PARAM_CHECK_ERROR);
}
$data='';
$temp='';
$count=0;
foreach($data as $k=>$v) {
if(!is_string($k)) {
break;
}
$count++;
if($count>1 & $temp=$k) {
die(ERROR_CONSTRUCTION_COUNT);
}
$temp=$k;
$data.=$delimiters[0].$k.$delimiters[1].$v.$delimiters[2].$k.$delimiters[3];
}
return $data;
}
?>
Ну, здесь я немного поясню. В качестве параметра функция принимает массив.
Структура массива должна быть такой:
"индификатор языка"=>"текст";
После мы делаем проверку, что если полученный параметр не массив то <пока Вася
!>.
Если же это всё же массив то конечно делаем его перебор, и на место языка в
конструкции ставим ключ данного элемента ассоциативного массива, а на место
текста безусловно сам текст а то есть значение переменной $v. После сливаем все
данные в одну строку. Но я забыл упомянуть об одной важной детали, а другими
словами о довольно большом куске текста. Сначала перед циклом мы объявили три
переменные: data, temp, count;
Переменная count- это количество итераций цикла, и с каждым следующим кругом
цикла счётчик увеличивается. Переменная data- это будущая результирующая строка,
в которую будут сливаться все языковые конструкции. Но более интересны
переменные count и temp. Для чего они нужны? Ну, наверное, большинство уже
догадались, прочтя исходник, но тем до кого ещё не <дошло> я поясню. Это
делается для проверки того, что языковая конструкция не была повторена более
раза. Для этого мы и объявили переменную count. Так как её значение по умолчанию
равно нулю, то мы проверяем, что цикл был выполнен хотя бы раз, поскольку если
мы этого не сделаем то, выйдет что-то подобное 2=2 или 0=0, ведь значение $k ещё
не успело измениться. Так как в первый раз проверка будет игнорироваться, мы
после проверки присваиваем значение переменной $temp. Это делается так же не
просто так. При первой итерации всё пойдёт нормально, но ведь если мы всё же
присвоили значение до проверки, то проверка делала бы проверку, о которой уже
упоминалось (2=2, 3=3 и т.д.). Вот зачем мы делаем именно так.
Теперь как логическое завершение мы создадим небольшой сайт, где и будет
применяться всё вышеизложенное:
<?
function subTextByLang($data,$lang,
$delimiters=array('<%','%>','<%/','%>')) {
$data=substr(
$data,
(strpos($data,$delimiters[0].$lang.$delimiters[1])+
strlen($delimiters[0].$lang.$delimiters[1])),
(strpos($data,$delimiters[2].$lang.$delimiters[3])-strlen($data))
);
if(trim($data)=='') {
$data=NOT_ENTERED;
}
return $data;
}
function compilateLanguageString($data,
$delimiters=array('<%','%>','<%/','%>')) {
if(!is_array($data)) {
die(PARAM_CHECK_ERROR);
}
$data='';
$temp='';
$count=0;
foreach($data as $k=>$v) {
if(!is_string($k)) {
break;
}
$count++;
if($count>1 & $temp=$k) {
die(ERROR_CONSTRUCTION_COUNT);
}
$temp=$k;
$data.=$delimiters[0].$k.$delimiters[1].$v.$delimiters[2].$k.$delimiters[3];
}
return $data;
}
//Не забываем о <статике>
if(!isset($_GET['lang'])) {
setcookie("lang",$_GET['lang']);
header("Location: index.php?module=home");
}
if(isset($_COOKIE['lang'])) {
include $_COOKIE['lang']."_map.php";
}
else {
include "ru_map.php":
}
if(isset($_POST['add'])) {
$description=compilateLanguageString(
array($_POST['description_en'],$_POST['description_ru']));
$title=compilateLanguageString(
array($_POST['titlte_eng'],$_POST['title_ru']));
//Процесс добавления в базу
}
echo"<html>";
echo"<head>";
echo"<title>";
$title=($_SERVER['REMOTE_ADDR']=='127.0.0.1')? ADMIN_WELCOM: 'Гостям- Здрасте
!';
echo $title;
echo"</title>";
echo"<meta http-equiv=\"Content-Type\" Content=\"text/html;
charset=".CURR_CHARSET."\">";
echo"</head>":
echo"<body>";
$conn_id=@mysql_connect("localhost","root","");
@mysql_select_db("somedatabase");
$q=@mysql_query("SELECT title, description FROM `articles` LIMIT 0,1",$conn_id);
if(@mysql_ num_rows($q)==0){
ARTCILES_NOT_FOUNDED;
}
else {
$row=@mysql_fetch_array($q);
$title=subTextByLang($row['title'],$lang);
$description=subTextByLang($row['description'],$lang);
echo"<table width=\"400\" height=\"50\" align=\"center\">":
echo"<tr><td>".ARTICLE_TITLE_TEXT."</td><td>".
$title."</td></tr>";
echo"<tr><td colspan=\"2\" style=\"text-align:center\">".
ARTICLE_DESCRIPTION_TEXT."</td></tr>";
echo"<tr><td colspan=\"2\">".$description."</td></tr>";
echo"</table>";
}
@mysql_close($conn_id);
//Это ещё полбеды, теперь нужно создать форму для добавления статьи
echo"<form action=\"\" method=\"post\">";
echo"<table width=\"400\" height=\"50\" align=\"center\">";
echo"<tr><td>".ARTICLE_TITLE_TEXT.
"(EN):</td><td><input type=\"text\" ".
"name=\"title\"></td></tr>";
echo"<tr><td>".ARTICLE_TITLE_TEXT."
(RU):</td><td><input type=\"text\" ".
"name=\"title\"></td></tr>";
echo"<tr><td colspan=\"2\" style=\"text align:center\">".
ARTICLE_DESCRIPTION_TEXT."(EN):</tr></tr>";
echo"<tr><td colspan=\"2\" >";
echo"<textarea name=\"description_eng\" rows=\"5\" cols=\"50\"".
">English description</textarea>";
echo"</td></tr>";
echo"<tr><td colspan=\"2\" style=\"text-align:center\">".
ARTICLE_DESCRIPTION_TEXT."(RU):</tr></tr>";
echo"<tr><td colspan=\"2\" >";
echo"<textarea name=\"description_ru\" rows=\"5\" cols=\"50\">".
"Русское описание</textarea>";
echo"</td></tr>";
echo"<tr><td colspan=\"2\"><input type=\"submit\" ".
"name=\"add\" value=\"Добавить\"></td></tr>";
echo"</table>";
echo"</form>";
?>
Что ж вот и всё. Однако в скрипте есть одно "но", автор не может через форму
добавить более двух вариантов перевода. Не буду, как остальные автора, что
сделал это для вашей тренировки, поскольку если честно то когда я дошёл до этого
места у меня уже голова почти не варила, поэтому я и оставляю это на ваших
плечах. Поверьте, вариантов решения полно, и я очень надеюсь, что вы его
найдёте. Относительно функций, то не могу сказать на все 100% что они не вызовут
сбоя но фатальных ошибок быть не должно, хотя всякое бывает. Но я уверен более
чем на 60% что синтаксис нарушен, так как я не тестировал примеры. А вот здесь
для вас действительно хорошая тренировка ведь ловля "блох" очень полезное
занятие!
Что ж, я считаю, что на этом статью можно окончить. Если у вас не будет
получаться, не сгоняйте зло на ваш бедный компьютер, на клавиатуру, и тем более
на разработчиков такого замечательного языка как РНР, смело, все свои неудачи
адресуйте в мою сторону. Я не думаю, что мне от этого станет хуже, а вот вам
будет на кого согнать злость. |