[РЕШЕНО] egrep (в отличие от awk) не понимает интервалов в сирийском

Delles · Сообщение **Delles** » 09 окт 2015, 17:43

$ echo 'ܫܠܡܐ' > peace
$ egrep '\<[ܐ-ܬ]' peace
grep: Неверный знак сортировки
$ awk /'\<[ܐ-ܬ]'/ peace
ܫܠܡܐ
$

Я посмотрел на сайте GNU, вроде бы там есть версия grep поновее, чем в Росе. Мне самому, в принципе, достаточно и awk'a, но, вообще говоря, если есть более новая grep, то почему бы ей не быть в Росе?..

PS: в арабском egrep интервалы понимает.

Сообщение **keleg** » 09 окт 2015, 17:44

Кстати о. 41 огнелис должен уже понимать сирийские... как их там? В общем я проверял - вроде работает.

Barmalei · Сообщение **Barmalei** » 09 окт 2015, 17:52

keleg писал(а):Кстати о. 41 огнелис должен уже понимать сирийские... как их там? В общем я проверял - вроде работает.

Арабский язык, но у него несколько диалектов.

Delles · Сообщение **Delles** » 09 окт 2015, 17:57

keleg писал(а):Кстати о. 41 огнелис должен уже понимать сирийские... как их там? В общем я проверял - вроде работает.

Стыдно сказать, но я поленился до 41 обновиться. А вообще у Огнелиса с письменностями всё очень хорошо (сужу по колонке языков в Википедии и, особенно, по сайту с переводами песен Высоцкого — последний словно создан для тестирования восприимчивости браузера к письменностям). Хромиуму приходилось кое-какие нужные мне шрифты доустанавливать, а Огнелис — всегда готов.

Delles · Сообщение **Delles** » 09 окт 2015, 18:00

Barmalei писал(а):Арабский язык, но у него несколько диалектов.

Сирийский — это не арабский. Это язык арамейской группы со своими разновидностями письма.

Barmalei · Сообщение **Barmalei** » 09 окт 2015, 18:05

Delles писал(а):
Barmalei писал(а):Арабский язык, но у него несколько диалектов.
Сирийский — это не арабский. Это язык арамейской группы со своими разновидностями письма.

А какой же? Везде пишут арабский. Арамейскую первый раз слышу. Аравийская может быть.

Delles · Сообщение **Delles** » 09 окт 2015, 18:16

Barmalei писал(а):А какой же? Везде пишут арабский. Арамейскую первый раз слышу. Аравийская может быть.

Совсем-совсем не арабский, и не аравийский. Посмотрите в Википедии статьи "Сирийский язык" и "Сирийское письмо".

Barmalei · Сообщение **Barmalei** » 09 окт 2015, 18:19

Delles писал(а):
Barmalei писал(а):А какой же? Везде пишут арабский. Арамейскую первый раз слышу. Аравийская может быть.
Совсем-совсем не арабский, и не аравийский. Посмотрите в Википедии статьи "Сирийский язык" и "Сирийское письмо".

Мы наверное в разных Википедиях сидим.

Delles · Сообщение **Delles** » 09 окт 2015, 18:24

Barmalei писал(а):Мы наверное в разных Википедиях сидим.

Сирийский язык: https://ru.wikipedia.org/wiki/%D0%A1%D0 ... 1%8B%D0%BA

Сирийское письмо:
https://ru.wikipedia.org/wiki/%D0%A1%D0 ... 0%BC%D0%BE

Сообщение **keleg** » 09 окт 2015, 18:27

Delles писал(а):
keleg писал(а):Кстати о. 41 огнелис должен уже понимать сирийские... как их там? В общем я проверял - вроде работает.
Стыдно сказать, но я поленился до 41 обновиться. А вообще у Огнелиса с письменностями всё очень хорошо (сужу по колонке языков в Википедии и, особенно, по сайту с переводами песен Высоцкого — последний словно создан для тестирования восприимчивости браузера к письменностям). Хромиуму приходилось кое-какие нужные мне шрифты доустанавливать, а Огнелис — всегда готов.

А скажите шрифты? Добавим.

Delles · Сообщение **Delles** » 09 окт 2015, 19:12

keleg писал(а):А скажите шрифты? Добавим.

Прекрасная мысль! Пусть Роса будет еще лучше и в этом отношении.

Сирийские шрифты можно взять здесь: http://www.bethmardutho.org/index.php/r ... fonts.html
Функционально нужные там:
SyrCOMEdessa.otf – эстрангела
SyrCOMNisibin.otf – восточносирийский
SyrCOMUrhoy.otf – западносирийский

Коптский шрифт здесь: http://www.moheb.de/unicode_coptic_fonts.html
Самый используемый: Antinoou
К сожалению, сервер работает плохо. Мне пришлось идти на archive.org, заходить на сохраненную копию этого сайта и скачивать шрифт оттуда. Ирония судьбы в том, что на archive.org тоже доступ нестабильный, но через плагин anonymoX открывается всегда.

Деванагари (chandas) можно взять здесь: http://www.sanskritweb.net/cakram/

Уйгурско-старомонгольский шрифт я получил от коллег. Он называется monbaiti.ttf но в сети я навскидку не нашел его в доступе. О наличии или отсутствии монгольского шрифта можно судить, переключившись на китайскую страницу Википедии о ком-нибудь из ханов, например, Чингисе — https://zh.wikipedia.org/wiki/%E6%88%90 ... D%E6%B1%97 —

Что касается арабского, то пока что из мной опробованных безупречно работает в LO только Times New Roman, остальные мне известные делают ошибки при растягивании строк. Но в ближайшем будущем, возможно, положение изменится в лучшую сторону благодаря объявленному Ubuntu развитию арабской реализации — https://www.surveymonkey.com/r/ubuntuarabicfonttesting
Тот шрифт, который они планируют как собственно убунтовский (для интерфейса), конечно, несерьёзен, но есть надежда, что на этой волне появятся хорошие арабские шрифты, нужно следить за проектом.

Спасибо!

Delles · Сообщение **Delles** » 09 окт 2015, 21:01

keleg писал(а):Кстати о. 41 огнелис должен уже понимать сирийские... как их там? В общем я проверял - вроде работает.

Ура! Теперь и ранее не работавшие лигатуры (ComposeKey) работают.
Спасибо!!!

Сообщение **keleg** » 10 окт 2015, 05:22

во-во, правильное слово, лигатуры

trs · Сообщение **trs** » 10 окт 2015, 09:28

Прошу прощения за поддержку оффтопа, но спор похоже возник на ровном месте.

Delles писал(а):
Barmalei писал(а):А какой же? Везде пишут арабский. Арамейскую первый раз слышу. Аравийская может быть.
Совсем-совсем не арабский, и не аравийский. Посмотрите в Википедии статьи "Сирийский язык" и "Сирийское письмо".

Воспользуюсь "оригиналом" предложенных статей: https://en.wikipedia.org/wiki/Syriac_language

…also known as Syriac Aramaic, is a dialect of Middle Aramaic…

Верно, "арамейский".

Смотрим дальше (в русскоязычной версии информация отсутствует):

Many Syriac words, like those in other Semitic languages…

идём дальше: https://en.wikipedia.org/wiki/Semitic_languages

Among them are the Ugaritic, Phoenician, Aramaic, Hebrew, Syriac, Arabic, and South Arabian alphabets.

Видно, что результат зависит (как минимум) от способа классификации, а так же от языка Википедии.
Так что я бы воздержался от категоричных отрицаний.

Так можно дойти и до вопроса : на каком языка написан Линух, на С, или на английском…

Delles · Сообщение **Delles** » 10 окт 2015, 12:59

trs писал(а):Semitic_languages
Among them are the Ugaritic, Phoenician, Aramaic, Hebrew, Syriac, Arabic, and South Arabian alphabets.

Понятно, что и сирийский, и арабский — семитские. Но утверждать на этом основании, что сирийский — это арабский, столь же нелепо, как утверждать, что еврейский — это арабский, оба ведь тоже семитские. Сирийский — это не арабский, речь была только об этом.

trs · Сообщение **trs** » 10 окт 2015, 14:55

Delles, мы с Вами тоже говорим на разных языках, хотя формально он один. На "этом" основании подобных утверждений не было. Мой пост вообще был о том, что вместо "совсем-совсем не" корректней было бы написать "принято относить к…", что бы избежать малоинформативного спора.

Delles · Сообщение **Delles** » 10 окт 2015, 15:57

trs писал(а):Delles, мы с Вами тоже говорим на разных языках, хотя формально он один. На "этом" основании подобных утверждений не было. Мой пост вообще был о том, что вместо "совсем-совсем не" корректней было бы написать "принято относить к…", что бы избежать малоинформативного спора.

Как минимум грамматически у нас с Вами язык один, лексически — в общем тоже, письменность одна и та же. А у сирийского с арабским разные грамматики, разная лексика, разные письменности. Ни один араб никогда не признает, что сурйāнӣ — это его язык. Если Вам больше нравится "принято относить", я не возражаю. Я возражаю только против утверждения, что сирийский — это арабский. Так же возражал бы, если бы кто-то сказал, что болгарский — это русский (оба славянские). За оффтоп, конечно, прошу прощения у сообщества, но сирийским и арабским я занимаюсь уже 20 лет, поэтому неточности такого уровня хочется устранить.

Сообщение **keleg** » 10 окт 2015, 15:59

ну, это уж явный оффтопик, завязывайте

evb0110 · Сообщение **evb0110** » 10 окт 2015, 22:46

Возможно, кому-то пригодится — надеюсь, не офтоп.
Сегодня решал проблему неюникодного же grep'a на Mac OS. По совету опытных товарищей установил MacPorts, установил его grep, сделал "export LC_ALL=en_US.UTF-8", и всё заработало: