Домой / Скайп / Кириллические url. Русский язык в URL. Что такое кириллический домен

Кириллические url. Русский язык в URL. Что такое кириллический домен

Итак, сегодня хотела написать немного об использовании кириллицы в ЧПУ. На мой взгляд русскоязычные ссылки были бы очень хороши, если бы не... Ходят слухи что они не доступны браузерам, поисковикам и другим системам, а в адресной строке браузера отображается что-то совершенно ужасное. Вот о всех плюсах, минусах, слухах и реализации на сайтах я бы и хотела рассказать.

Итак, пример того как можно использовать русский язык в URL можно увидеть прямо в адресной строке вашего браузера. Там должно быть написано следующее:

Http://сайт/news/2009/09/08/Русский_язык_в_URL.html

Заглянем что говорит по этому поводу официальная спецификация HTML 4.01 :

B.2.1 Non-ASCII characters in URI attribute values Although URIs do not contain non-ASCII values authors sometimes specify them in attribute values expecting URIs (i.e., defined with %URI; in the DTD ). For instance, the following href value is illegal : href ="http://foo.org/Håkon" >... We recommend that user agents adopt the following convention for handling non-ASCII characters in such cases: - Represent each character in UTF-8 (see ) as one or more bytes. - Escape these bytes with the URI escaping mechanism (i.e., by converting each byte to %HH, where HH is the hexadecimal notation of the byte value). This procedure results in a syntactically legal URI (as defined in , section 2.2 or , section 2) that is independent of the character encoding to which the HTML document carrying the URI may have been transcoded.

Что примерно означает следующее:

Хотя URL (есть разница между URL и URI, но тут она не важна), дожен содержать только латинские (ASCII) символы, бывает что авторы вставляют их в значение ссылок. Например в следующем примере значение атрибута href неправомерно: href ="http://vasya.ru/Вася_Пупкин" >... Рекомендуем браузерам сделать следующее: - Заменить каждый символ кодировкой urf-8 - Кодировать эти символы побайтно экранированием url, т.е. шеснадцатиричными значениями (каждый байт будет %HH). В итоге ваш URL будет синтаксически верен.

Отметим особо, что ссылка у нас получилась в (экранированной) кодировке UTF-8 , и её длинна соответственно возрасла. Вебмастера чьи сайты используют в качестве основной кодировки win-1251 (как например этот сайт) должны обрабатывать имя ссылок особо, например можно перевести её в нужную вам кодировку.

В IE8 к сожалению чистый русский язык будет только если там адрес вбивать вручную. Но, таков уж IE =).

В яндексе русский язык в url прекрасно понимают, и даже используют для поиска.


Гугл словам в ссылках значения не даёт, кроме того, слова соединённые через подчёркивание считаются с его точки зрения одним, для разделителей лучше использовать минус (дефис). Этот факт горячо обсуждался на xpoint.ru. Однако правильно сформированные русскоязычные ссылки он тоже отображает.

Теперь время для небольшого интервью, я опросила коллег на эту тему:

если например ссылка в utf-8?
Jelu (программист): ну кракозябра сверху) вообще считаю что это плохо давно хотела спросить кое что про оптимизацию. Как влияет на оптимизацию русский язык в url? @ (оптимизатор): не знаю что даже и ответить, думаю что зависит от того что ты хочешь получить в результате, т.е. для чего делается эта ссылка. но думаю что большого траста она не придаст, а смысл передается анкором, думаю что русский язык тут не причем. @: я не знаю как конкретно поисковик относится к ссылкам на русском языке. ну если говорить в общем о том как она влияет, я склонен думать что никак. На релевантность влияет текст на странице, но никак не ссылающийся на нее урл. привет. твоё мнение о использовании русского языка в url? ov3r (программист): привет. отрицательно, хотя бы из-за различных кодировок твоё мнение о использовании русского языка в url? Джехи (программист): только что обнаружил, что бл***ая сапа обрезает урлы длиннее 255 символов, что меня огорчило. поскольку у меня урленкод на > 255 сиволов от русского языка. с**и пи***ы. в остальном длинные русские урлы красивы, приятны, удобны, всеми понимаются и повышают релеванстность. твоё мнение о использовании русского языка в url? Dark Lord (программист): шняга!

Прокоментируй статью, хотя бы пару слов!

Комментарии:

    Итак, ярослав, для того чтобы сделать url на русском, предполагается что у вас уже есть реализация url на английском, если вы сами писали себе сайт.
    В базе данных, url хранится в кодировке utf-8[u], не важно в какой кодировке сам сайт. Если сайт в кодировке 1251, то при сохранении конвертируете кодировку в Utf-8.
    Когда вы показываете ссылку на странице блога - нужно также ту часть которая содержит русский язык обработать php-функцией urlencode.
    Соответственно потом, чтобы найти новость, вы парсите url, и ищете по той части его которая содержит русский язык. sql запрос выглядит примерно так:
    SELECT ... where ... CONVERT(`caption_latin` USING utf8) = CONVERT("".$pname."" USING utf8) ..., где caption_latin имя столбца содержащего ваш url в кодировке utf8.

    я только начинающий веб-мастер, поэтому мне кое что непонятно. Если честно мне бы подошла инструкция "для чайников" по этому вопросу))
    как сохранить кодировку в Utf-8?
    как обработать русский язык php-функцией?
    что такое парсить url?
    Извеняюсь если какие то вопросы покажутся смешными, но я только учусь)
    Ещё хорошо бы было показать пример кода до и после (т.е. какие изменения в код нужно внести что бы получить русские буквы в URL), думаю новичкам таким как я так будет легче разобраться.
    Заранее спасибо.

    Прошло 2 года спустя публикации этой статьи. Народ вовсю пользует возможность задавать кириллические ссылки; Яша этому рад; саперы тоже рады; не слишком давно регистраторам разрешили раздавать IDN-домены; даже зону на кириллице ввели (хотя и выдают, как я понял, алиасы для каждого домена в уникоде)...
    Все это не может не радовать.
    А вот делать правильный редирект (имею ввиду 301) научились не все(?). Потому как header`ы не принимают кириллические ссылки. Чего только не делют похапэшники со строками перед вставкой в header("Location: ".СЮДА);

    У автора (меня т.е.) соображения конечно есть. Подготовка ссылки для 301 редиректа вообще никак не отличается от подготовки ссылки для html. Я уже писала о том мой блог поддерживает автоисправление ссылок.
    Вот ради интереса можете стереть в адресной строке год, или месяц, или вообще дату целиком. Или можете просто нажать . Вас снова поредиректит на эту статью.
    В случае если у вас движок хранит данные в win-1251 вам следует выполнить 2 действия:

    • Перевести поле отвечающее за ЧПУ ссылки в кодировку UTF8
    • Выводить это поле в ссылке, используя urlencode() в PHP. (не всю ссылку а только данную часть url).
    Если у вас движок всё хранит в utf - ну вы поняли, да? =)
  • Долго я возился с этим...

    И раньше все делал как и было сказано в статье: переводил в utf-8, потом экранировал. По-разному экспериментировал...
    А оказалось, проблема в том, что urlencode() просто экранировал слеш.

    Спасибо, из-за статьи снова взялся разбираться с функцией. Разобрался) Вот ф-ция на php:

    function redirectto($redirect_link)
    {
    $redirect_link=iconv("windows-1251", "utf-8", $redirect_link);
    $redirect_link=urlencode($redirect_link);
    $redirect_link=str_replace("%2F", "/", $redirect_link);
    header("Location: ".$redirect_link."");
    }

    День добрый. У меня такой вопрос... Обо всем по порядку. Хочу сделать, чтобы urn имел возможность быть на русском (да, вот так я выразился)).
    Собственно, что делать?)
    Пользователь пытается зайти на адрес host.domen/2011/статья-1/
    Как мне перехватить это? Ловить все запросы отправляемые на 404? Но тогда будет возвращаться код 404 вместо 200. Или сделать "мягкую ошибку 404" с кодом возврата 200? (кстати как это сделать не понимаю).
    Или настраивать.htaccess для редиректа 301? Но тогда будет делаться редирект (парадокс, да?))... А в силу того, что имена всех файлов и папок на хосте только латиницей url будет меняться на host.domen/2011/statja-1/ (это верный адрес страницы). Но я такой не хочу) Хочу чтобы в строке адреса так и отображался host.domen/2011/статья-1/ Используя ErrorDocument 404 адрес в адресной строке остается как раз таким. Что позволяет немного обмануть природу и использовать русский на сервере, где это делать нельзя) Вобщем, есть идеи?

    Буду копать пока mod_rewrite

    Таки мощный инструмент mod_rewrite. Но малость неудобно с ним работать. Можно было сделать проще. Хотя, это, судя по всему, вызвано его внутренней сложностью. Или просто влияние "старой школы". Все-таки когда он был разработан то. Ну да не суть, главное сделал я все) Но с mod_rewrite вариант оказался не таким гибким. Лучше такие всю обработку оставить на php собирая неверный запросы в 404.

    В нашем движке используется следующее правило для mod_rewrite:

    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteRule ^(.*)$ index.php?rewrite_url_query_toget=$1

    Можно использовать просто RewriteRule ^(.*)$ index.php , но в таком случае адрес страницы нужно брать из переменной $_SERVER["REQUEST_URI"] что будет не совсем верно если движок установлен в папку, а не в корень.

    Собирать страницы через обработку 404 запросов, не совсем правильно. Во-первых может быть что по умолчанию вернётся 404 статус. Во-вторых апач может попытаться отдать страницу через протокол HTTP 1.0 вместо HTTP 1.1, потому что страницу 404 нужно возвращать именно через HTTP 1.0, т.е. не используя метод chunked для выдачи, что тоже приведёт к ошибке. И т.п.
    А mod_rewrite действительно сложен именно в силу своей универсальности. При должном изучении вы сможете с помощью его делать очень многое.

    Ну первые две проблемы решаются с помощью посылки заголовка HTTP/1.1 200 Ok. Но в том, что это не совсем правильно, я, конечно, согласен) Это все-таки обходной путь. Я бы его не трогал, если бы все ровненько "склеилось" с mod-rewrite. У меня склеилось, но как-то кривовато. Ну за час этот механизм не освоить точно. Попробую поэкспериментировать с Вашими командами в mod_rewrite.

    Всем привет! Увидел просьбу прокомментить хоть на пару слов, и вот у меня сайты на WordPress, там это дело автоматизировано во всех записях и страницах использую название на русском языке, отображается во всех основных браузерах нормально. И реально для пользователя это удобно.

    Прикольная у вас страница ошибки)))))

    Вы блин не залогинились и не поставили галочку. Ваш комментарий не сохранён. На случай если вы таки не бот, то вот он, скопируйте и попробуйте снова:

    Здравствуйте!
    В ie ваша ссылка отражается закодированной. Я так понимаю для ie на русском ссылки не зделать? Если фильтровать пользователей по браузерам и генерировать ссылки на русском для всех, кроме ie и на транслите для ie, то поисковики будут воспринимать данную страницу как две. Получается, что надо все делать в транслите или есть все-таки решения?

    В адресную строку вводим например: mysite/?привет
    код php
    $chpu = $_SERVER["REQUEST_URI"];
    echo $chpu;
    код php
    выводит что-то типо того: %D0%BF%D1%80%D0%B8%D0%B2%D0%B5%D1%82
    вставляете в базу данных этот код и наслаждаетесь:)

    Влад, в ие - страница будет отображаться закодированной только до 9й версии. Это менее 5% от всех браузеров.

    Здравствуйте, очень интересная статья, многого не знал.
    Однако я не совсем понял, как всё-таки решить проблему отображения русских символов в URL.
    Я посмотрел "сырой исходник" (в Opera это Crl+U), и увидел, что у вас ссылка, на самом деле - UTF-8 после экранирования (escaped). Но при наведении в статусбаре браузера видны кракозябры, а после перехода - получается русский текст, как и надо. Уж как только не пробовал - и с экранированием, и без, и во всех кодировках (без конвертирования в UTF-8 и с оным). У меня при любом раскладе после перехода по ссылке получаются экранированные символы =(

    UPD: разобрался. Оказывается, такой фокус не проходит с параметром. Только с частью пути, но не query_string. Мне кажется, стоит дополнить этот нюанс - а то мало ли. Мне-то и нужен был как раз путь, но для теста я сдуру выбрал параметр. Интересно, к слову, чем вызвана эта особенность, и кто всё-таки преобразует неэкранированные символы в экранированный вид - браузер или же веб-сервер. Ещё было бы интересно понять, что же уходит на сервер, когда в адресной строке видны русские буквы. Украшательство ли это со стороны браузера, или они правда уходят без экранирования?

    И да, с параметрами тоже не всё так просто - ставил я однажды nginx без Apache, так там, кажется, параметры так и оставались на русском без замены... И вроде даже пришлось менять PHP код, чтобы оно заработало (хотя БД в той же кодировке была, что на девелоперском сервере). rewrite срабатывал, а данные приходили "плохие", как-то так.

    На т.н. location.hash - т.е. всё что существует после решётки существует своя спецификация. Поэтому да, браузер её увы экранирует.


Самостоятельный

1. Купить кириллическое доменное имя.
2. Заказать хостинг.
3. Привязать это доменное имя к этому хостингу.
4. Создать сайт, содержащий страницу «контакты». Проще всего создать директорию «контакты» и в ней файл «index.html».
5. Залить созданный сайт на хостинг.

Только учти, что на хостинге директория сайта будет называться не «сайт. рф», а «xn--80aswg.xn--p1ai» (да и по сети адрес будет передаваться в таком виде): для обеспечения совместимости с любыми браузерами доменные имена кодируются вhttps://ru.wikipedia.org/wiki/Punycode. Поиграться с кодировкой:https://www.punycoder.com

Так что Сфера ниже ошибается: домен будет доступен в любой точке мира и поисковики его прекрасно проиндексируют. Андрей 2

Всего 3 .

с точки зрения SEO — замена URL входящей ссылки?

Андрей Ш. 4

При условии изменения контента и/или отсутствия 301 редиректа эффект может быть как положительным, так и отрицательным в зависимости от многих факторов, в первом ряду которых контент новой страницы, входящие внутренние ссылки сайта-донора и входящие внешние ссылки на страницу-донор.

Евгений Ю. 3

Если вы сменили URL входящей ссылки, оставив тот же анкор, что и был ранее, то скорее всего ссылочный вес, который передавался ранее не будет такой же, как с со страницы с новым URL. Т.е. новая входящая ссылка будет передавать минимальный вес на сайт-акцептор и лишь со временем наберет «вес».Благодаря факторам, например:возраст страницы, количество трафика на нее, количество ссылающихся на нее внутренних страниц сайта, анкоры внутренних ссылок,количество внешних ссылок и виды анкоров на данную страницу и т.д. Антон Величко -1

Всего 2 .

Какой смысл в кириллическом домене «.рф», если есть такие домены как «.ru» и «.su»?

Gent. Regger. 7

Я считаю, что это было первым шагом для создания нашего, уникального, высокодуховного интернета с Спортлото и комсомолками. Осталось теперь признать латиницу оскорбляющей чувства россиянина, отделить интернет от Запада, заодно и от Китая с его АлиЭкспресслм, и оставить только один сайт «в контакте», ну, разве ещё, одноклассники и сайт раша тудей с первым каналом.

Сергей Рассказов 7

Всего 4 .

Как получить галочку?

Гость 1

Чтобы мой инбокс не был забит вопросами о галочке,пишу сразу как её получить.
Не должно быть:
1.Мата
2.Игры/конкурсы (%,факты,лт)
3.Просьба о взаимных подписок/вопросов/лайков.(В ответах).
Если у тебя все с этим хорошо,то идем дальше
1.У вас должно быть больше 800 ответов.
2.Больше 1000 подписчиков,чем больше тем лучше.
3.Профиль не ваш,тк нет ваших фото и/или этот профиль сделан для других целей (размещение цитат из фильмов, жизненные советы, смешные мемы, и т. д.).Обязательно должно быть ваше фото (2 пожеланию свои)
4.Активный профиль, т.е каждый день заходишь на аск и отвечаешь на 5 и более вопросов в последнее несколько недель.
Если у тебя все это есть.
5.Переходим по ссылкеhttp://support.ask.fm/ics/support/ticketnewwizard.asp?style=classic
6.Заполняем несколько строчек о себе:Full Name -Ваше полное имя и фамилия, Email — адрес электронной почты; Inquiry Type — Account Verification;открывается еще несколько строчек Profile URL — ссылка на ваш аккаунт; Your number of followers — количество подписчиков; Subject — пишем «Верификация аккаунта» (без кавычек);* Explain in details(maximum 64,000 characters)
— пишем «Здравствуйте! Хочу получить галочку и готов пройти процедуру верификации.» (так же можно рассказать о себе где вы прославились чем занимаетесь,прикрепить ссылки на аккаунты,но это пожеланию).
7.Нажимаем финиш >>>
Далее:
8.Ждем письма от Аска, готово/отказ.Если ваш аск подходит под на галочку,то нас попросят сделать селфи с листком на бумаге,где от руки написано ваше имя пользователя и сегодняшняя дата и четко видно полностью вашу руку,что вы держите листок и ваше полное лицо (самое главное),что это вы.
Что писать на листке? Берете любой листок.Обязательно с @ ваше имя пользователя и дата,когда пришло вам это письмо.Отправляете на ответное письмо.С текстом «Вот доказательства» (без ковычек)
9.Ждем еще сутки письмо.Где нас поздравляют с получением галочки.И радуемся.
Запрос я отправлял 14 марта ночью в 0:41; и в этом день попросили сделать селфи в 16:00 ; И на следующий день получил галочку в 14:01
Надеюсь я подробно объяснил и вы сможете получить галочку,тут рассказал малейшие детали.Для её получения.
Скринhttps://pp.userapi.com/c836439/v836439430/2b55c/AnlMBXPbPWs.jpg
Если у вас возникли какие-то проблемы напишите мне помогуhttps://vk.com/maksimovde .Олег 300

Всего 1

Сегодня я решил затронуть тему продвижения кириллических доменов. Я отношусь к ним весьма предвзято, поэтому статья будет субъективной, и не будет претендовать на истину. Кроме моего мнения, опыта, и некоторых моментов, уточненных в Google, я попросил знакомого (обладателя кириллического домена) также описать основные нюансы работы с кириллическими доменами, плюсы и минусы. В итоге, получилось много информации, которую я сейчас попытаюсь структурировать.

Что такое кириллический домен

Итак, что собой представляет кириллический домен. Не углубляясь в техническую сторону, можно сказать, что такой домен указывается кириллическими символами, и предназначен для улучшения читабельности и запоминаемости. За почти 30 лет существования системы доменных имен (DNS разработана в 1984 году) все привыкли к доменам в латинице, появление кириллических доменных имен в 2010 году, вызвало небывалый ажиотаж в интернет-обществе. Многие IT-специалисты скептически отнеслись к такому нововведению, уже тогда увидев недостатки использования кириллицы в доменах. Простые же юзеры Сети обрадовались, за первые 6 часов существования зоны «.рф», было зарегистрировано 183 000 кириллических доменов .

Применение кириллических доменов

Первыми кириллическими доменами стали президент.рф и правительство.рф. Спустя некоторое время (конец 2009 – начало 2010), регистрация кириллических доменных имен стала доступной владельцам торговых знаков, позже — для всех резидентов России. Сейчас насчитывается уже несколько десятков кириллических доменных зон, включая «.укр», «.бел», и другие региональные и тематические домены.

Область применения кириллических доменных имен весьма обширна, их используют правительственные и частные организации, интернет-магазины, компании любого уровня, блогеры. Многие вебмастера используют кириллические домены в качестве дополнительных зеркал для своих сайтов. Часто компании покупают такие имена лишь для того, чтобы обезопасить себя от киберсквоттинга.

Преимущества и недостатки

Использование кириллических доменов имеет свои плюсы и минусы. Лично для меня, минусов гораздо больше (включая как объективные, так и субъективные факторы), однако, я честно попытался найти хоть что-то в пользу кириллических доменов. Давайте попытаемся перечислить и то, и другое.

Преимущества кириллических доменов

  1. Домен с использованием кириллицы удобно читать и запоминать . Встречается информация, что такие домены созданы как раз для людей, не очень хорошо понимающих транслитерацию и английский язык.
  2. Возможность добавления ключевых слов в домен , без использования транслита. Имхо, данный пункт не очень однозначный, не наблюдал выраженной зависимости позиций СДЛ от ключа в домене. Лучше потратить больше времени на грамотный нейминг.
  3. Большой выбор свободных доменных имен в кириллических зонах. Тогда как на латинице за три десятка лет «вкусных» доменов осталось довольно мало — введение кириллицы дало шанс найти такой домен для своей компании. Впрочем, через несколько лет этого преимущества уже не будет, скорее всего.

На этом, пожалуй, и все.

Недостатки кириллических доменов

  1. Некоторые браузеры по-разному копируют адрес сайтов . Например, в Google Chrome домен копируется в буфер только в Punycode, тогда как Mozilla Firefox позволяет скопировать домен из адресной строки в кириллице.
  2. Отсутствие возможности создания корпоративной почты для домена. К сожалению, кириллические домены пока нельзя корректно использовать для создания почтового адреса. Можно только использовать адрес в Punycode. Например, вместо «admin@домен.рф», адрес будет выглядеть как «[email protected]». Согласитесь, не очень удобно. Правда, Google не так давно заявил о начале поддержки кириллицы в адресах почт, но пока ее станут корректно воспринимать почтовики и начнут поддерживать другие поисковики (в Рунете, безусловно, основная почта для домена — от Яндекс) — пройдет не один год.
  3. Возможны проблемы при работе со ссылочными биржами , в частности, GGL (GoGetLinks). Дело в том, что часть адреса сайта (доменное имя) трансформируется в Punycode, а сам адрес страницы/папки/ресурса (URL) передается в шестнадцатеричной системе Unicode (UTF-8, как правило). В итоге, адреса могут быть очень и очень длинными, и из-за ограничений систем бирж, могут быть проблемы.
  4. Могут быть сложности с установкой и администрированием CMS . На данный момент, с популярными CMS проблем не должно быть, но вот с самописами или не очень хорошо развивающимися системами могут быть сложности.
  5. Есть информация, что некоторые онлайн-антивирусы могут некорректно работать с кириллическими адресами страниц.
  6. Зарубежные пользователи Сети будут испытывать сложности с доступом к сайту на кириллическом домене, из за проблем с кодировкой. На сегодняшний день, большинство браузеров научились правильно «понимать» и отображать кириллические адреса, но 100% гарантии нет.
  7. С кириллическими адресами неудобно работать оптимизатору/вебмастеру . Специфика нашей профессии такова, что часто приходится копировать адреса страниц, или же анализировать отчеты различных программ. Преобразованные в UTF урлы выглядят абсолютно нечитабельно, и понять, что за страница, можно лишь по title (без перехода по ссылке, разумеется).
  8. Ну и напоследок, если на компьютере не установлена русская раскладка клавиатуры — с введением адреса будут проблемы . Можно использовать виртуальную клавиатуру, конечно, но это не всегда предосталяется возможным, и мягко говоря, не особо удобно.

Заключение

Как я упоминал вначале — кириллические домены, в моем понимании, несут больше минусов, чем наоборот. Но я честно постарался обработать и систематизировать всю найденную и полученную по своим каналам информацию, чтобы каждый желающий приобрести такой домен, мог принять решение самостоятельно. Уверен, что еще год-второй — и описанных мною минусов станет на порядок меньше. Но для большинства интернет-старожилов, давно работающих в сфере WEB, кириллические домены так и продолжат оставаться чем-то слегка странным и неоднозначным. Возможно, среди нас просто много консерваторов 🙂

А каково ваше мнение относительно достоинств и недостатков кириллических доменов?

28.03.2018 Время прочтения: 1 минута

С 21 декабря 2017 г. Google публикует SEO-фрагменты (SEO Snippets) – короткие обучающие видео. Ниже перевод очередного SEO-фрагмента.

Сегодня вопрос задаёт Джон Мюллер из Швейцарии, т.е. я Вопрос в следующем: можно ли в URL-адресе использовать неанглийские слова? Владельцам сайтов, ориентированных на пользователей за пределами англоязычных регионов, иногда неясно, можно ли использовать местный язык и неанглийские символы в URL-адресах.

Поисковая система Google использует URL-адреса прежде всего для того, чтобы добраться к фрагменту контента – по нему бот Google сканирует содержимое страницы и добавляет ее в выдачу. Если URL-адреса действительны и уникальны, проблем не возникнет. Для доменных имен и доменов верхнего уровня нелатинские символы кодируются с помощью конвертера Punycode. Звучит немного странно, поэтому приведу пример: возьмём мою фамилию Мюллер (Müller). Над второй буквой имеются точки, поэтому в качестве имени домена она будет выглядеть иначе после кодировки – «müller» -> «xn-mller--kva». Обе версии эквиваленты для поисковой системы Google. Остальная часть URL-адреса может быть закодирована с помощью системы Unicode, UTF-8 для нелатинских символов. Вне зависимости от языка, сделайте URL-адрес простым для пользователей – избегайте пробелов, запятых и других символов. Используйте тире для разделения слов в адресе. Некоторые предпочитают использовать знак нижнего подчеркивания – так тоже можно, но тире легче распознается. Если ваш сайт доступен в нескольких языковых версиях, используйте соответствующий язык в URL-адресе для страниц контента на этом языке. Итак, подводя итоги, скажу: использовать неанглийские слова в URL-адресах можно, делать это следует для неанглоязычных сайтов.