@drq Ну не на белорусском же ты пишешь) А я просто не люблю, когда компьютер сомневается в моих настройках. Если поставил русский по умолчанию, значит пишу на русском. Если захочу написать на карельском, поставлю галочку без помощи бота(на самом деле нет, ибо галочки карельского языка не существует примерно нигде) @dside @mrclon
@volandevsrat @drq @dside На самом деле нужна просто чуть более сложная логика, которая бы реализовала такую стратегию: если весь пост на неродном для тебя языке — переключать автоматически. Но если есть хоть слово на кириллице — считать пост русскоязычным. А сейчас какая-то странная пропорция.
Олсо, для автопереключения нужно еще со словарями сверяться, лишняя работа (я, правда, не знаю, как оно реализовано, а экспериментировать нет желания).
@johan Как по мне, разработчики только лишние силы на это тратят. Уж лучше тыкать галочки, которые и так близко расположены, чем решать такие проблемы @drq @dside @mrclon
@drq @volandevsrat @dside Ну, считай: Отправить пост, понадеявшись на автопереключение; открыть его для проверки; увидеть, что не сработало; нажать редактирование; исправить язык; отправить заново.
По данным fedidb.com/ Федиверсом пользуются 12.2 миллиона человек, из которых около миллиона - активно.
Давай возьмем этот самый активный миллион и предположим, что они делают постов, ну скажем, хотя бы по 12 в день, включая ответы. Для простоты будем считать, что все они - билингвы.
Итак, 3,5 умножаем на миллион, да на 12 - получаем 42000000 секунд.
Это 1 год, 3 месяца, 30 дней, 2 часа и 40 минут. То есть, каждый день вся сеть коллективно теряет около одного человекогода. То есть, по грубым прикидкам, за сезон мы "хороним" примерно одну человеческую жизнь.
Мелкие проблемы в UX - нифига не мелкие, когда вспоминаешь, что этой штукой не ты один пользуешься. Слыхал о такой максиме, что каждый клик на пути до цели срезает количество пользователей вдвое?
Если вычислять для одного человека, который пишет 12 постов, он потратит 48 секунд(и то в случае, если постоянно чередовать языки в каждом посте, чего никто не делает) из условных 4 часов в сутки, которые он тратит на мастодон. Да, люди тратят секунды на переключения языков из выделенного времени на соц сети. Оптимизация была бы необходима, если бы мы все были ботами на зарплате в офисе с нормой в 12 постов в день. Тогда бы мы коллективно задерживались на 1 год, 3 месяца, 30 дней и тд. Но в реальности юзер и так потратит условные 4 часа на соцсети, только 48 секунд из них будут потрачены на переключение языка.
(А если отходить от моих аргументов — я не особо понимаю, зачем считать человекочасы в соцсетях. Мы ж тут развлекаемся ) @johan @dside @mrclon
а) мы тут собрались ради того, чтобы общаться, а не ради того, чтобы элементами управления в интерфейсе щелкать, не так ли. Посему время, потраченное мимо общения можно считать потраченным впустую
и
б) чем больше времени в системе тратится впустую, тем меньше ей хочется пользоваться. А мы все-таки хотим, чтобы нашей штукой хотело пользоваться как можно больше людей. Соответственно, необходимо снижать трение, которое в нашем случае и так гигантское из-за объективных недостатков федерации. Здесь же трение в принципе решаемо, а значит абсолютно необязательно.
Поэтому, если один раз сделать грамотный детектор языков, который срубит 95% случаев переключения, это не просто сэкономит куче народа кучу времени, но и повысит конверсию.
@drq Это какое-то инженерское желание оптимизировать абсолютно всё. Такого я понять не смогу... (Напридумывают своих оптимизаций, а нормисы(я) после физмата в дурку уезжают ) @johan @dside @mrclon
Означает мелкий и совершенно необязательный недочет, вносящий в пользовательский опыт трение, а у самого пользователя - вызывающий возмущение.
Дьявол прячется в деталях, и даже полностью корявый и неудобный UI будет лучше того, что поверхностно, вроде как сделан как надо, но на самом деле полон вот таких мелких "пейперкатов". От первого - ты хотя бы знаешь что ожидать, и что это будет больно. Вторым же ты будешь пользоваться, но он будет систематически тебя бесить и доведет в итоге до белого каления. Ну, знаешь, как пытка каплями воды на темя.
И опять же, прочти пост повнимательнее, я не забыл, я пренебрег для простоты рассуждения. Конкретная цифра потерянного времени не суть важна, суть в том, что если вспомнить про многопользовательность, она растет *быстро*.
Окей, даже если принять, что например, их половина от этой суммы пользователей. Ладно, хорошо, тогда одного человека мы убиваем не за один сезон, а за два. Лучше, что-ли.
@drq проблема с такими расчетами и рассуждениями в том что они псевдонаучны и маскируют эмоциональный аргумент под рациональной.
Псевдонаучны потому что надо учитывать ложно положительные срабатывания и сравнивать их с истинно положительными — тогда может оказаться что на самом деле система спасет 100 человеколет взамен 1 загублено — читателей то больше в кучу раз. Поэтому считать надо в заработанных деньгах — там сложно ошибиться.
А с эмоциональными аргументами проблема в их раздробленности и непоследовательности. Ты мог мог бы сохранить 48 секунд в год просто забив на существование выпадашки языка. А сколько времени ты бы сохранил если бы не проставлял альты, которые все равно проставит бот. Кнопка отправки поста же не блокируется из-за пустого альта или неуверенности машины в языке. Но они красятся в эмоционально неприятный красный и жёлтый.
Я за то чтобы сделать систему лучше, но не с наколеночными циферками
А мы не можем сейчас учитывать ложноположительные срабатывания по той простой причине, что прямо сейчас срабатывать особо-то и нечему. Не с чем сравнивать.
И да, я, конечно, могу игнорировать выбор языка. Но тогда те, кто читает посты только на английском, и отфильтровывает посты на всех остальных языках, могут меня и не услышать, а это меня не устраивает, ибо посты на английском я пишу именно для них, для англоязычных пользователей. Да и плюс, приятно, когда данные категоризированы.
Мой вердикт - автопереключалку все же стоит сделать. Но только при условии, что сделана она будет хорошо. И, разумеется, будет опциональной для всех, кто не хочет ей пользоваться.
А мы не можем сейчас учитывать ложноположительные срабатывания по той простой причине, что прямо сейчас срабатывать особо-то и нечему. Не с чем сравнивать.
И да, я, конечно, могу игнорировать выбор языка. Но тогда те, кто читает посты только на английском, и отфильтровывает посты на всех остальных языках, могут меня и не услышать, а это меня не устраивает, ибо посты на английском я пишу именно для них, для англоязычных пользователей. Да и плюс, приятно, когда данные категоризированы.
Мой вердикт - автопереключалку все же стоит сделать. Но только при условии, что сделана она будет хорошо. И, разумеется, будет опциональной для всех, кто не хочет ей пользоваться.
@volandevsrat @drq совсем убрать, я считаю, скорее вредно, но улучшить определённо надо.
Видимо, там предсказание исходит из предположения, что "самый вероятный" вариант правильнее; если там предсказывалка выдаёт список с "уверенностями"[0][1], и уверенность в уже выбранном языке достаточно высокая, то предупреждение не надо показывать. Но этот пороговый показатель уверенности надо осторожно подобрать, и для этого не помешали бы примеры плохих распознаваний.
Ну и я согласен, что нужна возможность это наглухо выключить.
В пулреквесте[0] в целом признают, что дизайн сыроват, и надеются его с обратной связью улучшить. Ну давайте им с этим поможем, например.
Use a client-side library to detect and subtly suggest when the user is typing in a language different to the selected one.
Peek.2024-11-23.03-59.mp4
Fixes #25568
@volandevsrat @drq пощупал этот lande, у него очень сильно падает уверенность даже на просто "Привет" — хотя на *настолько* коротких вводах этого может и следует ожидать:
Hi, I have no experience in this kind of stuff, so I'll just ask about it to get more information. The following text: It may die when I die, and that’s okay. It’s my earnings. Gets detected as Afr...
@bano я пощёлкал на разных простых предложениях и пока пребываю под впечатлением, что как кандидатуры стоит рассматривать все языки, для которых возвращается вероятность больше 1% (я думал, что там будет что-то в духе 10-80%, но нет, топовый язык обычно 80%+, а 100% вероятности, по ходу, размазаны по всем 50 языкам из поддерживаемых, поэтому оставшимся 49 остаётся <20%).
Она явно напрашивается на улучшения изнутри, да, но может и снаружи можно её сделать чуть менее дурной, если не слишком ей верить.
@dside @volandevsrat @drq такие ошибки фиксятся приложением к результатам распознавания настроек пользователя, в которых сказано на каких языках он обычно пишет. Если человек не указал что он шпрехает по белорусский, значит нехуй его детектить, выбирай наиболее подходящий вариант из предложенных пользователем
D:\side\>
в ответ на MrClon • • •так и есть. И если на неё нажать, на самом верху будет предполагаемый.
Русский язык оно со скрипом распознаёт, да. С белорусским путает как минимум.
Dr. Quadragon ❌
в ответ на D:\side\> • • •@dside Я бы, честно говоря, добавил сюда полностью автоматический режим, в котором если этой кнопке че-то не нравится, она сама бы и переключалась.
А то как-то дохера трудно посты стало писать - и описание к картинкам добавь, и язык переключи.
К тому моменту, как все эти ритуалы будут выполнены - уже перехочется писать что бы то ни было вообще.
Как будто ведешь не микроблог, а полноценный лонгформ, только с тесным лимитом по символам.
@mrclon
Вяйнё
в ответ на Dr. Quadragon ❌ • • •@drq
Лучше всё-таки убрать этой кнопке "интеллект".
Написано на кириллице? У пользователя по умолчанию русский? Значит это русский.
А то как-то шизово, когда ты пишешь пост на русском, а сайт в этом сомневается...
@dside @mrclon
Dr. Quadragon ❌
в ответ на Вяйнё • • •Я пишу посты на разных языках. Многие делают так же.
@dside @mrclon
Вяйнё
в ответ на Dr. Quadragon ❌ • • •Ну не на белорусском же ты пишешь)
А я просто не люблю, когда компьютер сомневается в моих настройках. Если поставил русский по умолчанию, значит пишу на русском. Если захочу написать на карельском, поставлю галочку без помощи бота(на самом деле нет, ибо галочки карельского языка не существует примерно нигде)
@dside @mrclon
Dr. Quadragon ❌
в ответ на Вяйнё • • •@volandevsrat Постов на английском у меня примерно столько же, сколько на русском и я заебся выставлять эту долбанную настройку.
@dside @mrclon
Вяйнё
в ответ на Dr. Quadragon ❌ • • •На мошидоне галочки находятся близко.
А как в вебе я не помню
@dside @mrclon
Dr. Quadragon ❌
в ответ на Вяйнё • • •𝙹𝚘𝚑𝚊𝚗
в ответ на Вяйнё • • •@volandevsrat @drq @dside
На самом деле нужна просто чуть более сложная логика, которая бы реализовала такую стратегию: если весь пост на неродном для тебя языке — переключать автоматически. Но если есть хоть слово на кириллице — считать пост русскоязычным. А сейчас какая-то странная пропорция.
Олсо, для автопереключения нужно еще со словарями сверяться, лишняя работа (я, правда, не знаю, как оно реализовано, а экспериментировать нет желания).
Вяйнё
в ответ на 𝙹𝚘𝚑𝚊𝚗 • • •Как по мне, разработчики только лишние силы на это тратят. Уж лучше тыкать галочки, которые и так близко расположены, чем решать такие проблемы
@drq @dside @mrclon
Dr. Quadragon ❌
в ответ на Вяйнё • • •@volandevsrat Нет, не лишние. Объясню.
Сколько ты времени тратишь, чтобы переключить язык?
@johan @dside @mrclon
𝙹𝚘𝚑𝚊𝚗
в ответ на Dr. Quadragon ❌ • • •@drq @volandevsrat @dside
Ну, считай: Отправить пост, понадеявшись на автопереключение; открыть его для проверки; увидеть, что не сработало; нажать редактирование; исправить язык; отправить заново.
Всего-ничего 😕
Dr. Quadragon ❌
в ответ на 𝙹𝚘𝚑𝚊𝚗 • • •@johan Я не тебя спрашивал, и я сейчас говорю а) не о failure mode и б) не о случае с автопереключением вообще.
@volandevsrat @dside @mrclon
Вяйнё
в ответ на Dr. Quadragon ❌ • • •Ну 3-4 секунды занимает
(Могло бы быть и быстрее, если бы на мошидоне эта функция не висела бы на другом краю экрана)
@johan @dside @mrclon
Dr. Quadragon ❌
в ответ на Вяйнё • • •Ого, 3-4.
Начинаем считать.
По данным fedidb.com/ Федиверсом пользуются 12.2 миллиона человек, из которых около миллиона - активно.
Давай возьмем этот самый активный миллион и предположим, что они делают постов, ну скажем, хотя бы по 12 в день, включая ответы. Для простоты будем считать, что все они - билингвы.
Итак, 3,5 умножаем на миллион, да на 12 - получаем 42000000 секунд.
Это 1 год, 3 месяца, 30 дней, 2 часа и 40 минут. То есть, каждый день вся сеть коллективно теряет около одного человекогода. То есть, по грубым прикидкам, за сезон мы "хороним" примерно одну человеческую жизнь.
Мелкие проблемы в UX - нифига не мелкие, когда вспоминаешь, что этой штукой не ты один пользуешься. Слыхал о такой максиме, что каждый клик на пути до цели срезает количество пользователей вдвое?
@johan @dside @mrclon
Вяйнё
в ответ на Dr. Quadragon ❌ • • •Если вычислять для одного человека, который пишет 12 постов, он потратит 48 секунд(и то в случае, если постоянно чередовать языки в каждом посте, чего никто не делает) из условных 4 часов в сутки, которые он тратит на мастодон. Да, люди тратят секунды на переключения языков из выделенного времени на соц сети. Оптимизация была бы необходима, если бы мы все были ботами на зарплате в офисе с нормой в 12 постов в день. Тогда бы мы коллективно задерживались на 1 год, 3 месяца, 30 дней и тд.
Но в реальности юзер и так потратит условные 4 часа на соцсети, только 48 секунд из них будут потрачены на переключение языка.
(А если отходить от моих аргументов — я не особо понимаю, зачем считать человекочасы в соцсетях. Мы ж тут развлекаемся
)
@johan @dside @mrclon
Dr. Quadragon ❌
в ответ на Вяйнё • • •Да, но
а) мы тут собрались ради того, чтобы общаться, а не ради того, чтобы элементами управления в интерфейсе щелкать, не так ли. Посему время, потраченное мимо общения можно считать потраченным впустую
и
б) чем больше времени в системе тратится впустую, тем меньше ей хочется пользоваться. А мы все-таки хотим, чтобы нашей штукой хотело пользоваться как можно больше людей. Соответственно, необходимо снижать трение, которое в нашем случае и так гигантское из-за объективных недостатков федерации. Здесь же трение в принципе решаемо, а значит абсолютно необязательно.
Поэтому, если один раз сделать грамотный детектор языков, который срубит 95% случаев переключения, это не просто сэкономит куче народа кучу времени, но и повысит конверсию.
@johan @dside @mrclon
Вяйнё
в ответ на Dr. Quadragon ❌ • • •Это какое-то инженерское желание оптимизировать абсолютно всё. Такого я понять не смогу...
(Напридумывают своих оптимизаций, а нормисы(я) после физмата в дурку уезжают
@johan @dside @mrclon
Dr. Quadragon ❌
в ответ на Вяйнё • • •Есть в UX такой термин - "бумажный порез" (кстати, ввели его именно линуксоиды, чем можно гордиться).
en.wikipedia.org/wiki/Paper_cu…
Означает мелкий и совершенно необязательный недочет, вносящий в пользовательский опыт трение, а у самого пользователя - вызывающий возмущение.
Дьявол прячется в деталях, и даже полностью корявый и неудобный UI будет лучше того, что поверхностно, вроде как сделан как надо, но на самом деле полон вот таких мелких "пейперкатов". От первого - ты хотя бы знаешь что ожидать, и что это будет больно. Вторым же ты будешь пользоваться, но он будет систематически тебя бесить и доведет в итоге до белого каления. Ну, знаешь, как пытка каплями воды на темя.
@johan @dside @mrclon
trivially fixable usability bug
Contributors to Wikimedia projects (Wikimedia Foundation, Inc.)Ваня
в ответ на Dr. Quadragon ❌ • • •Dr. Quadragon ❌
в ответ на Ваня • • •С ответами - легко.
И опять же, прочти пост повнимательнее, я не забыл, я пренебрег для простоты рассуждения. Конкретная цифра потерянного времени не суть важна, суть в том, что если вспомнить про многопользовательность, она растет *быстро*.
Окей, даже если принять, что например, их половина от этой суммы пользователей. Ладно, хорошо, тогда одного человека мы убиваем не за один сезон, а за два. Лучше, что-ли.
@volandevsrat @johan @dside @mrclon
Ваня
в ответ на Dr. Quadragon ❌ • • •@drq проблема с такими расчетами и рассуждениями в том что они псевдонаучны и маскируют эмоциональный аргумент под рациональной.
Псевдонаучны потому что надо учитывать ложно положительные срабатывания и сравнивать их с истинно положительными — тогда может оказаться что на самом деле система спасет 100 человеколет взамен 1 загублено — читателей то больше в кучу раз. Поэтому считать надо в заработанных деньгах — там сложно ошибиться.
А с эмоциональными аргументами проблема в их раздробленности и непоследовательности. Ты мог мог бы сохранить 48 секунд в год просто забив на существование выпадашки языка. А сколько времени ты бы сохранил если бы не проставлял альты, которые все равно проставит бот. Кнопка отправки поста же не блокируется из-за пустого альта или неуверенности машины в языке. Но они красятся в эмоционально неприятный красный и жёлтый.
Я за то чтобы сделать систему лучше, но не с наколеночными циферками
@volandevsrat @johan @dside @mrclon
Dr. Quadragon ❌
в ответ на Ваня • • •А мы не можем сейчас учитывать ложноположительные срабатывания по той простой причине, что прямо сейчас срабатывать особо-то и нечему. Не с чем сравнивать.
И да, я, конечно, могу игнорировать выбор языка. Но тогда те, кто читает посты только на английском, и отфильтровывает посты на всех остальных языках, могут меня и не услышать, а это меня не устраивает, ибо посты на английском я пишу именно для них, для англоязычных пользователей. Да и плюс, приятно, когда данные категоризированы.
Мой вердикт - автопереключалку все же стоит сделать. Но только при условии, что сделана она будет хорошо. И, разумеется, будет опциональной для всех, кто не хочет ей пользоваться.
@volandevsrat @johan @dside @mrclon
𝙹𝚘𝚑𝚊𝚗
в ответ на Dr. Quadragon ❌ • • •#Mastodon #MastodonTools #виброкодинг #ChatGPT #NeuralNetwork #userscript
Ну, допустим, я сделяль © Потому что сделать — не проблема. Проблема — придумать логику, которая без лишних вопросов покроет все варианты постов со смеш
анными алфавитами.Auto-language select before publish
RE: mastodon.ml/@drq/1151209130385…
GitHub - Johan-foreva/mastodon-language-auto-select-userscript: Auto-language select before publish
GitHubDr. Quadragon ❌
2025-08-31 02:02:08
𝙹𝚘𝚑𝚊𝚗 поделился этим.
D:\side\>
в ответ на Вяйнё • • •@volandevsrat @drq совсем убрать, я считаю, скорее вредно, но улучшить определённо надо.
Видимо, там предсказание исходит из предположения, что "самый вероятный" вариант правильнее; если там предсказывалка выдаёт список с "уверенностями"[0][1], и уверенность в уже выбранном языке достаточно высокая, то предупреждение не надо показывать. Но этот пороговый показатель уверенности надо осторожно подобрать, и для этого не помешали бы примеры плохих распознаваний.
Ну и я согласен, что нужна возможность это наглухо выключить.
В пулреквесте[0] в целом признают, что дизайн сыроват, и надеются его с обратной связью улучшить. Ну давайте им с этим поможем, например.
[0]: github.com/mastodon/mastodon/p…
[1]: npmjs.com/package/lande — tl;dr: да, там есть показатели уверенности
Add warning when selected and detected language is different in web UI by Gargron · Pull Request #33042 · mastodon/mastodon
GitHubD:\side\>
в ответ на D:\side\> • • •Ваня
в ответ на D:\side\> • • •@dside вроде как автор нейронки знает о том что она может давать ложные результаты
github.com/fabiospampinato/lan…
Но v2 так и нет
@volandevsrat @drq @mrclon
It detects other language but it should be English
patrickReiis (GitHub)D:\side\>
в ответ на Ваня • • •@bano я пощёлкал на разных простых предложениях и пока пребываю под впечатлением, что как кандидатуры стоит рассматривать все языки, для которых возвращается вероятность больше 1% (я думал, что там будет что-то в духе 10-80%, но нет, топовый язык обычно 80%+, а 100% вероятности, по ходу, размазаны по всем 50 языкам из поддерживаемых, поэтому оставшимся 49 остаётся <20%).
Она явно напрашивается на улучшения изнутри, да, но может и снаружи можно её сделать чуть менее дурной, если не слишком ей верить.
@volandevsrat @drq @mrclon
MrClon
в ответ на D:\side\> • • •