Қатысушы талқылауы:AlefZet/LanguageKk kz.php

Уикипедия — ашық энциклопедиясынан алынған мәлімет
Навигацияға өту Іздеуге өту

увидел знакомую проблему: спряжение казахских слов. тоже ломал голову, уж слишком много исключений :)) заметил след.:

  1. ілік септік: -ның/-нің: не согласен на счет слов, заканчивающихся на у, и, ю(?): қарудың, мидың
т.е. к константе $sonantStems добавить ещё и и и ю (у в списке уже есть)?
    • думаю, стоит проверять сперва на -дың/-дің, затем на -ның/-нің
какая разница? ведь это же elseif
    • учтены ли случаи спряжения местоимений: менің, сенің, оның (меннің, сеннің, олдың);
никак, ведь grammar применяется не ко всякому слову, а тому которое извлекается из переменной, а переменную выдает MediaWiki.
  1. барыс: в каком случае присоединяются окончания -на/-не? если в случае, как с жұмыс+ы+на, то программа выдаст жұмыс+ы+ға
тут надо как-то выделить тауелдік жалғау, не получится из-за обилия слов с такой же финалью (жалко, что казахский кодифицировал не эсперантист :)). к сожалению, к притяжательным никак не применимо :(
    • опять же местоимения: маған, саған, оған (менге, сенге, олға)
  1. табыс: -ны/-ні: ми+ды (ми+ны), қару+ды (қару+ны)

если считать буквы и и у только сонантами, никаких подводных камней не вылезет?

    • когда используется ?: если в жұмыс+ы+н, то выдаст жұмыс+ы+ны
  1. опять же местоимения: мені, сені, оны (менні, сенні, олды)
  2. жатыс: тоже самое, что и в табыс септік;
  3. шығыс: похоже, что у тебя после согласных ж,з не рассматриваются для -дан/-ден, т.е. подпадают под -нан/-нен: жаз+дан (жаз+нан)
похоже, таблицы не совсем верные?
  1. көмектес: местоимения: менімен, сенімен, онымен (менмен, сенмен, олмен)

если чем могу быть полезен, то буду рад помочь GaiJin 15:25, 26 қыркүйек 2006 (UTC)

Для других языков grammar реализован ещё примитивнее. Кроме тувинского, см. для примера, основной код я заимствовал отсюда. Тағы қараңыз http://svn.wikimedia.org/viewvc/mediawiki/trunk/phase3/languages/ --AlefZetт 18:48, 26 қыркүйек 2006 (UTC)
ввёл формы possessive--AlefZetт 15:25, 28 қыркүйек 2006 (UTC)

извини, тәуелдік жалғау не проверял. у меня вопрос, откуда взялась буква "ý"? у Қайдара ее нет, насколько я помню. GaiJin 04:31, 29 қыркүйек 2006 (UTC)

У Қайдара много чего не было. :) Букву «Ý» пришлось ввести для однозначной взаимно-обратной автоматической транслитерации «Й», также как и «Ï» (вообще-то я предлагал ҚазАқпарату букву «Î» для кириллической «И» в традициях турецкой латиницы - крышечка обозначает долгие гласные, а «И», как дифтонг, можно представить как своего рода долгий, тогда как точечки обозначают гласные переднего ряда, «мягкие»). --AlefZetт 08:23, 29 қыркүйек 2006 (UTC)
я помню, что вначале буквы Ï не было, а было сочитание Iy. но теперь, когда есть и Ï и Y, о какой неодназначности идет речь? можно хотя бы один пример? GaiJin 05:57, 30 қыркүйек 2006 (UTC)
Да любые сочетания Й + гласный: если yo -> ё, ya -> я, yu -> ю, то дәйексөз -> däyeksöz -> дәексөз, майор -> mayor -> маёр, Нью-Йорк -> Nʹyu-York -> Нью-Ёрк и т.д.; если yo -> йо, ya -> йа, yu -> йұ, то жою -> joyu -> жойұ, жаяу -> jayaw -> жайау. Кстати, опять же для однозначности, а также для правильной работы функции grammar надо бы транслитерировать так: Ю -> YW (ведь по правилам й+у -> ю), а не как Ю -> YU --AlefZetт 08:51, 30 қыркүйек 2006 (UTC)
это на практике получаестя? если верить мануалю пхп, функция strtr() will always look for the longest possible match first. GaiJin 11:02, 30 қыркүйек 2006 (UTC)
Да, так и получается. Причём, от языка программирования никак не зависит. Только от правил транслитерации и инвентаря используемых символов.--AlefZetт 22:39, 30 қыркүйек 2006 (UTC)

понял. а в каком алфавите будут сохраняться тексты? и в каком редактироваться? GaiJin 10:47, 30 қыркүйек 2006 (UTC)

Это конвенциональный вопрос, т.е. ИМХО «в каком алфавите статья написана, в таком и должна редактироваться» (в кириллице и латинице), пользователь же сможет прочитать по своему усмотрению в одном из трёх алфавитов, включая арабицу. Дефолтным считается кириллица. Пользователь сможет по свему усмотрению в своих настройках может выбирать предпочтительный вариант алфавита в котором будет обычно читать. Помимо этого он может в любой момент посмотреть статью в любом алфавите. Как это работает можно сейчас посмотреть на примереsr: и zh:. В окошке редактирования текст показывается в том алфавите, в котором хранится в базе. Однако, пользователь сможет перекодировать (с помощью Викификатора в режиме транслитератора) избранный кусок текста в кириллицу или латиницу, а затем произвести редактирование, с условием, что он вернет кодировку к изначальной. Арабица исключается из процесса редактирования, поскольку полноценная реализация транслитерации из арабицы в латиницу или кириллицу практически невозможна, хотя бы из-за неразличения строчных и прописных букв. Попытка же использовать алгоритм аналогичный уордовскому только поганит результирующий текст. По крайней мере, другого выхода я не вижу.--AlefZetт 22:39, 30 қыркүйек 2006 (UTC)

sondiktan