[1-5]
[1-5]
2 down, keep it up!<playIcon></playIcon>
Два готовы <playIcon></playIcon> , продолжайте!
≥ 2 No votes
≥ 2 голосов «против»
≥ 2 Yes votes
≥ 2 голосов «за»
Abkhaz
Абхазский
About
Meiss
Accent
Акцент
Acehnese
Ачехский
{ $actionType }<playIcon></playIcon> did they accurately speak the sentence?
{ $actionType }<playIcon></playIcon> точно ли произнесено предложение?
{ $actionType }<recordIcon></recordIcon> then read the sentence aloud
{ $actionType } <recordIcon></recordIcon>, затем зачитайте предложение вслух
{ $actionType }<stopIcon></stopIcon> when done
{ $actionType } <stopIcon></stopIcon>, когда закончите
{ $actionType } submit when ready
{ $actionType } отправьте, когда будет готово
Add an avatar clip to your profile
Добавить аватар в ваш профиль
Add an avatar to your profile
Добавить аватар в свой профиль
Additional Language
Дополнительный язык
Add Language
Добавить язык
Adyghe
Адыгейский
Afrikaans
Африкаанс
Age
Ičä
Albanian
Албанский
All
Kõik
All voice clips in the dataset are scrubbed of personally identifying information. When a contributor provides demographic data via their profile, that information is de-identified from their voice clips before being bundled for download in the dataset and is never made public on their profile page.
Все голосовые записи в наборе данных очищаются от личной информации. Хотя участник предоставляет демографические данные через свой профиль, эта информация удаляется из записей перед тем, как добавляется в набор данных для загрузки, и никогда не публикуется на странице профиля.
Amharic
Амхарский
Anonymized user data like age, sex, and accent helps improve the audio data used to train the accuracy of speech recognition engines. Your username and email will never be associated with your submitted data, and you can choose whether to make your username public or anonymous.
Анонимные пользовательские данные такие, как возраст, пол и акцент помогут улучшить аудио-данные, используемые для тренировки точности движков распознавания речи. Ваше имя пользователя и адрес электронной почты никогда не будут связаны с предоставляемыми вами данными, и вы можете выбрать сделать ли ваш логин публичным или анонимным.
Arabic
Арабский
Aragonese
Арагонский
Artificial intelligence
Искусственный интеллект
Assamese
Ассамский
Asturian
Астурийский
Audio Format
Аудиоформат
Avatar
Аватар
Average
Keskolin
A voice clip is marked "valid" when a user gives it a Yes vote.
Запись отмечается как «корректная», когда пользователь выбирает «Да».
Awards
Награды
Azerbaijani
Азербайджанский
Back to Top
Ülespäi
Back to Top
Ülespäi
Bashkirs
Башкирский
Basque
Баскский
Become a partner
Стать партнёром
Benefits
Čäüttäjä bariššad
Bengali
Бенгальский
<bold>{ $count }</bold> Clips
<bold>{ $count }</bold> Клипов
<bold>Help us</bold> find more voices
<bold>Помогите нам</bold> найти больше голосов
<bold>iOS</bold> users can download our free app:
Пользователи <bold>iOS</bold> могут загрузить наше бесплатное приложение:
Both
Mõlõpõd
Both of these projects are part of our efforts to bridge the digital speech divide. Voice recognition technologies bring a human dimension to our devices, but developers need an enormous amount of voice data to build them. Currently, most of that data is expensive and proprietary.
We want to make voice data freely and publicly available, and make sure the data represents the diversity of real people. Together we can make voice recognition better for everyone.
Оба эти проекта являются частью наших усилий по заполнению пробела в цифровой речи. Технологии распознавания голоса вносят человеческое измерение в наши устройства, но разработчикам необходим огромный объем голосовых данных для их создания. В настоящее время, большая часть этих данных является дорогой и проприетарной.
Мы хотим, чтобы голосовые данные были свободными и общедоступными, и чтобы эти данные отражали разнообразие реальных людей. Вместе мы можем сделать распознавание голоса лучше для всех и каждого.
Both (Speak and Listen)
Mõlõpõd (Pajatõ i Kuuntõ)
Breton
Бретонский
Build a custom goal
Создать собственную цель
Build Profile
Создание профиля
Bulgarian
Болгарский
Buryat
Бурятский
<b>Why an email?</b> We may need to contact you in the future about changes to the dataset, an email provides us a point of contact.
<b>Зачем нужен ваш адрес?</b> В будущем нам может понадобиться связаться с вами по поводу изменений в наборе данных, и электронная почта позволит нам сделать это.
By editing your goal, you may lose your existing progress.
Изменив свою цель, вы можете потерять существующий прогресс.
By opting in to receive emails you state that you are okay with Mozilla handling this info as explained in Mozilla’s <privacyLink>Privacy Policy<privacyLink>.
Согласившись получать письма, вы заявляете, что согласны с тем, как Mozilla обрабатывает эту информацию, согласно <privacyLink>Политике приватности</privacyLink> Mozilla.
<b>You agree</b> to not attempt to determine the identity of speakers in the Common Voice dataset
<b>Вы соглашаетесь</b> не пытаться определять личность дикторов в наборе данных Common Voice
By providing some information about yourself, the audio data you submit to Common Voice will be more useful to Speech
Recognition engines that use this data to improve their accuracy.
Предоставив некоторые данные о себе, вы сделаете аудио данные, отправляемые в Common Voice, более полезными для движков распознавания речи, которые будут использовать эти данные для улучшения своей точности.
By using Common Voice, you agree to our <termsLink>Terms</termsLink> and <privacyLink>Privacy Notice</privacyLink>
Используя Common Voice, вы соглашаетесь с нашими <termsLink>условиями использования</termsLink> и <privacyLink>политикой приватности</privacyLink>
Cancel
Отмена
Cancel Re-recording
Отменить перезапись
Cancel Submission
Отменить отправку
Can't decide?
Etkö saa valitsa?
Catalan
Каталанский
Change your email via Settings under Login Identity
Измените свой адрес электронной почты через настройки в разделе «Идентификатор для входа»
Chinese (China)
Китайский (Китай)
Chinese (Hong Kong)
Китайский (Гонконг)
Chinese (Taiwan)
Китайский (Тайвань)
Chuvash
Чувашский
Click
Щёлкнуть
Clip Graveyard
«Кладбище записей»
Clips recorded
Клипов записано
Clips Uploaded
Записей загружено
Clips validated
Записей проверено
Clips You've Recorded
Вы записали
Clips You've Validated
Вы проверили
Close
Kuro
Close
Lummõ
Collecting sentences from the public domain, or writing new ones for the public domain.
Сбор предложений из общественного достояния или написание новых для общественного достояния.
Comment
Комментарий
Common Voice data plus all other voice datasets above.
Данные Common Voice плюс данные всех голосовых наборов данных ниже.
Common Voice Dataset
Common Voice salvo
Common Voice is a collaborative project, and we're depending on our community of partners and contributors to build the largest open-source dataset of voices ever.
We would like to thank the following people and organizations for their help with the project:
Common Voice — это совместный проект, и создание самого большого из когда-либо открытых наборов голосовых данных зависит от нашего сообщества партнёров и участников.
Мы хотели бы поблагодарить следующих людей и организации за помощь в реализации проекта:
Common Voice is Mozilla's initiative to help teach machines how real people speak.
Common Voice — kase on Mozilla duumõ, kui mašina õppõb kastõ, ku inimin jõka päive pajatõb.
Common Voice is part of Mozilla's initiative to help teach machines how real people speak.
Common Voice — это часть инициативы Mozilla по обучению машин тому, как говорят реальные люди.
Common Voice is part of Mozilla's initiative to help teach machines how real people speak. In addition to the Common Voice dataset, we’re also building an open source speech recognition engine called Deep Speech.
Common Voice — это часть инициативы Mozilla по обучению машин тому, как говорят реальные люди. Помимо набора данных Common Voice, мы также создаем движок распознавания речи Deep Speech с открытым исходным кодом.
Common Voice recordings are used by academics, small businesses, and voice recognition enthusiasts to help train and grow publicly available resources like voice models.
Can you let us know why you would like your recordings deleted?
Записи Common Voice используются учёными, малым бизнесом и энтузиастами распознавания голоса, чтобы обучать и развивать общедоступные ресурсы, такие как голосовые модели.
Можем ли мы узнать, почему вы хотите удалить свои записи?
Confirm Goal
Подтвердить цель
Connect with Gravatar
Присоединить Gravatar
Contact
Kontakti
Contact Form
Форма связи
Content available under a <licenseLink>Creative Commons license</licenseLink>
Содержимое доступно под <licenseLink>лицензией Creative Commons</licenseLink>
Continue
Продолжить
Contribute
Tee kaaz
Contribute
Принять участие
Contribute to { $lang }
Внесите вклад в { $lang } язык
Contribute Your Voice
Запишите свой голос
Contribution Activity
Вклад помощника
Contribution Experience
Оцените вашу работу с Common Voice
Contributors record voice clips by reading from a bank of donated sentences.
Участники делают голосовые записи, читая из банка пожертвованных предложений.
Cookies
Petšenjad
Cookies
Petšenjad
Cornish
Корнский
{ $count }mo
{ $count } kuutõ
{ $count }wk
{ $count } nätel̕iä
{ $count }y
{ $count } voottõ
Create a Custom Goal
Создать собственную цель
Create a custom voice wave to introduce yourself. Other users will be able to hover and listen to your clip.
Создайте собственное приветствие. Другие пользователи смогут прослушать его.
Create a voice clip as part of your profile avatar. Others will be able to hover and listen to your clip.
Присоединиться к рассылке Common Voice
Create Voicewave
Создать приветствие
Croatian
Хорватский
Czech
Чешский
Daily Goal
Ежедневная цель
Danish
Датский
Dashboard
Панель
Datasets
Salvod
Days
Päivä
De-identified
Обезличенный
DELETE
УДАЛИТЬ
Delete my recordings
Удалить мои записи
Delete Profile
Удалить профиль
Dhivehi
Мальдивский
Different language
Другой язык
Difficult
Rankkõ
Difficult to pronounce
Сложно произнести
Donate your voice
Õõ üvä I annõ õma ääni!
Don't see your language on Common Voice yet?
Пока не видите ваш язык в Common Voice?
Don’t see your language reflected in the Dataset? To request a language head over to our Languages page.
Вашего языка нет в наборе? Запросите его на странице Языки.
Download
Загрузить
Download Common Voice Data
Загрузить данные Common Voice
Download Data
Загрузить данные
Download Dataset Bundle
Загрузить пакет наборов данных
Download { $language }
Загрузить { $language }
Download My Data
Выгрузить мои данные
Do you have ideas on how we can make the Common Voice dataset better? Let us know on Discourse
Есть идеи, как улучшить Common Voice? Расскажите нам на форуме Discourse
Do you want to continue?
Tahatko jatkaa?
Do you want to Speak, Listen or both?
Вы хотите записывать, проверять или и то, и другое?
Drag and drop or <browseWrap>Browse</browseWrap>
Перетащите или <browseWrap>выберите файл</browseWrap>
During contribution submission feedback will be skipped after clicking 'Submit. Contribution will continue directly with the next set of 5 recordings or validations.
Оценка работы с Common Voice будет пропущена после нажатия кнопки «Отправить». И вы сможете продолжить вносить вклад, следующими записями или прослушиваниями.
Dutch
Голландский
Each entry in the dataset consists of a unique MP3 and corresponding text file. Many of the <b>{ $total }</b> recorded hours in the dataset also include demographic metadata like age, sex, and accent that can help train the accuracy of speech recognition engines.
The dataset currently consists of <b>{ $valid }</b> validated hours in <b>{ $languages }</b> languages, but we’re always adding more voices and languages. Take a look at our <languagesLink>Languages page</languagesLink> to request a language or start contributing.
Каждая запись в наборе данных состоит из уникального MP3-аудио и соответствующего ему текстового файла. Многие из <b>{ $total }</b> записей в этом наборе данных также включают в себя демографические метаданные, такие как возраст, пол и акцент, которые могут помочь увеличить точность обучения движков распознавания речи.¶
¶
В настоящее время набор данных состоит из <b>{ $valid }</b> проверенных часов на <b>{ $languages }</b> языках, но мы постоянно добавляем новые голоса и языки. Загляните на нашу <languagesLink>страницу языков</languagesLink>, чтобы запросить язык или принять участие.
Easy
Prosta
Edit
Редактировать
Edit Profile
Редактировать профиль
Email
Epošti
Email
Epošti
Email
Epošti
Email
Epošti
Email is already used for a different account
Электронная почта уже используется в другом аккаунте
Email Subscriptions
Подписки по электронной почте
English
agličina
English
agličina
English
aglitšina
Enter Email to Download
Введите адрес электронной почты для загрузки
Enter your email
Введите ваш адрес эл. почты
Erzya
Эрзянский
Esperanto
esperanto
Estonian
viro
Estonian
viro
Everyone
Все пользователи
Exit & Delete clips
Выйти и удалить клипы
FAQ
ЧЗВ
Faroese
Фарерский
Female
Nainõ
Finish editing first?
Хотите сначала закончить редактирование?
Finish recording
Закончите запись
Finish recording first?
Сначала закончите запись?
Finnish
soomõ
Finnish
soomõ
For these launched languages the website has been successfully <localizationGlossaryLink>localized</localizationGlossaryLink>, and has enough <sentenceCollectionGlossaryLink>sentences collected</sentenceCollectionGlossaryLink> to allow for ongoing <speakLink>Speak</speakLink> and <listenLink>Listen</listenLink> contributions.
Для этих языков веб-сайт был успешно <localizationGlossaryLink>локализован</localizationGlossaryLink>, и на нём было собрано <sentenceCollectionGlossaryLink>достаточно предложений</sentenceCollectionGlossaryLink>, чтобы начать <speakLink>сбор голосов</speakLink> и <listenLink>их проверку</listenLink>.
French
Французский
Frequently Asked Questions
Часто задаваемые вопросы
Frisian
Фризский
Fulah
Фула
Galician
Галисийский
GB
GB
Georgian
Грузинский
German
Немецкий
Get involved
Принять участие
Get involved
Принять участие
Get Involved
Tuõ appi
Get started with goals
Создать цель
Get Started with Speech Recognition
Как использовать Common Voice в своих программах
Give your avatar a voice
Дайте голос своему аватару
Glossary
Глоссарий
Goals
Цели
Go to Discourse
Перейти на Discourse
Go to Languages Page
Перейти на страницу Языки
Go to { $name }
Перейти на { $name }
Grammatical / spelling error
Грамматическая / орфографическая ошибка
Great! How many clips a week?
Отлично! Сколько записей в неделю?
Great! How many clips per day?
Отлично! Сколько записей в день?
Great!<recordIcon></recordIcon> Record your next clip
Отлично! <recordIcon></recordIcon> Запишите свой следующий клип
Great work!<playIcon></playIcon> Listen again when you're ready
Отличная работа! <playIcon></playIcon> Прослушайте снова, когда будете готовы
Greek
Греческий
Hakha Chin
Чинский
Hausa
Хауса
Have Feedback?
Оставить отзыв
Have questions about Common Voice? Ideas for improvements or feedback about a specific language? Join us on our <discourseLink>Discourse forum</discourseLink> and let us know.
У вас есть вопросы о Common Voice? Идеи по улучшению или отзывы о конкретном языке? Присоединяйтесь к нам на нашем <discourseLink>Discourse-форуме</discourseLink> и дайте нам знать.
Have you read our Terms?
Вы прочитали наши условия использования?
Having a profile is not required to contribute though it is helpful, see why below.
Наличие профиля не обязательно для участия, хотя это полезно
Hebrew
Иврит
Help
Api
Help
Api
Help Common Voice reach { NUMBER($hours) } hours in a language with a personal goal
Помогите Common Voice достичь { NUMBER($hours) } часов на этом языке с помощью личной цели
Help reach { NUMBER($hours) } hours in { $language } with a personal goal
Помогите достичь { NUMBER($hours) } часов на { $language } с помощью личной цели
Help teach machines how real people speak, donate your voice at { $link }
Avita õpõttaa kompjuteralõ kui õika inimin pajatõta, jagõ õma äänte kassen { $link }
Help teach machines how real people speak, donate your voice at { $link }
Avita õpõttaa kompjuteralõ kui õika inimin pajatõta, jagõ õma äänte kassen { $link }
Help us build a community around voice technology, stay in touch via email.
Помогите нам создать сообщество по языковым технологиям, оставайтесь с нами на связи по электронной почте.
Help us build a high quality, publicly open dataset
Avita meill kopitta kõvassi üvvä täätüsalvo, kumpa kõik savva takossa
Help us find more voices, share your goal
Помогите нам найти больше голосов, поделитесь своей целью
Help us find others to donate their voice!
Помогите нам, найдя других желающих записать свой голос!
Help us get to { $goal }
Avita meill tagotõlla { $goal }
Help us validate sentences!
Avitõ meill lukka!
Help us validate sentences!
Avitõ meill lukka!
Help us validate voices
Avittaga meill löütä õikad ääned
Hidden
Скрытый
Hill Mari
Горномарийский
Hindi
Хинди
Hours Recorded
Часов записано
Hours Validated
Часов проверено
{ $hours } validated hours so far!
Пока проверено { $hours } часа!
How ?
Как?
How can I get the Common Voice data?
Как я могу получить данные Common Voice?
How does Common Voice calculate hours?
Как Common Voice рассчитывает часы?
How does it work?
Как это работает
How do you ensure anonymity and privacy of the people who donated their voices?
Как вы обеспечиваете анонимность и конфиденциальность людей, которые пожертвовали свои голоса?
Hungarian
Венгерский
I agree
Я согласен(а)
I am a non-native speaker and I speak with an accent, do you still want my voice?
Я не являюсь носителем языка и говорю с акцентом, пригодится ли вам мой голос?
Icelandic
Исландский
I'd like to receive emails such as goal reminders, my progress updates and newsletters about Common Voice.
Я хочу получать такие письма, как напоминания о целях, уведомления о достижениях и новости о Common Voice.
I do not agree
Я не согласен(а)
I just created a personal goal for voice donation to #CommonVoice -- join me and help teach machines how real people speak { $link }
Я только что создал(а) личную цель для голосового пожертвования #CommonVoice -- присоединяйтесь ко мне и помогите машинам научиться понимать реальных людей { $link }
I’m afraid I don’t know what you’re looking for.
Я боюсь, что не знаю, что вы ищете.
I'm okay with you handling this info as you explain in Mozilla's <privacyLink>Privacy Policy</privacyLink>
Я согласен с тем, как вы обрабатываете эту информацию, согласно <privacyLink>Политики приватности</privacyLink> Mozilla
* Indicates required field
* поля, обязательные для заполнения
Indonesian
Индонезийский
In Progress
Идёт подготовка
Interlingua
Интерлингва
Irish
Ирландский
Is my account information public?
Является ли информация моего аккаунта публичной?
Is the clip valid?
Корректная ли запись?
Is the goal of Common Voice to build a voice assistant?
Является ли целью Common Voice создание голосового помощника?
Italian
Итальянский
It contains words or phrases that are hard to read or pronounce.
Содержит слова или фразы, которые трудно прочитать или произнести.
It is a long established fact that a reader will be distracted by the readable content of a page when looking at its layout.
Существует давно установленный факт, что читатель будет отвлекаться на удобочитаемое содержимое страницы при просмотре её макета.
It is written in a language different than what I’m speaking.
Написано на языке, отличном от того, на котором я говорю.
Izhorian
ižora
Japanese
Японский
Join the Common Voice mailing list
Сделайте голосовую запись частью аватара вашего профиля. Другие смогут прослушать её.
Kabyle
Кабильский
Kaqchikel
Какчикельский
Kazakh
Казахский
Keep
Оставить
Keep it up, record again <recordIcon></recordIcon>
Продолжайте, запишите ещё <recordIcon></recordIcon>
Keep the recordings
Сохранить мои записи
Keep track of your progress and metrics across multiple languages.
Следите за своим прогрессом и показателями на нескольких языках.
Keep track of your progress with a profile
Отслеживайте свой прогресс с помощью профиля
Keep track of your progress with a profile and help our voice data be more accurate.
Наблюдайте за прогрессом, пользуясь профилем, и помогайте улучшать точность наших голосовых данных.
Kinyarwanda
Руанда
Komi-Zyrian
Коми-зырянский
Korean
Корейский
Kurdish
Курдский
Kyrgyz
Киргизский
Language
Čeeli
Language
čeeli
Language Request
Запрос языка
Language request successfully submitted, thank you.
Запрос о добавлении языка успешно отправлен, спасибо.
Languages
Čeeled
Languages
Tšeeled
Latvian
Латышский
Launched
Запущены
Leaderboard Visibility
Показывать меня в топе
Leaving now means you’ll lose your changes
Уход сейчас означает, что вы потеряете сделанные изменения
Leaving now means you'll lose your progress
Уход сейчас означает, что вы потеряете свой прогресс
LibriSpeech is a corpus of approximately 1000 hours of 16Khz read English speech derived from read audiobooks from the LibriVox project.
LibriSpeech представляет собой собрание из примерно 1000 часов 16 кГц аудиозаписей английской речи, полученных из аудиокниг проекта LibriVox.
License
Лицензия
License: <licenseLink>CC-0</licenseLink>
Лицензия: <licenseLink>CC-0</licenseLink>
License: <licenseLink>{ $license }</licenseLink>
Лицензия: <licenseLink>{ $license }</licenseLink>
Ligurian
Лигурский
Link Copied
Ссылка скопирована
Listen
Слушайте
Listen
Kuulõ
Listening
Kuuntõmin
Listen-Queue
Очередь прослушивания
Lithuanian
Литовский
Loading…
Lastamin…
Loading…
Lastamin…
Localization
Локализация
Localized
Локализовано
Login Identity
Идентификатор для входа
Log in or sign up to get started
Войдите или зарегистрируйтесь, чтобы начать
Log In / Sign Up
Čirja süäme / Čirjoittassa
Log In / Sign Up with { $company } email
Čirja süäme / Čirjoittassa pruukkimizi { $company } poštika
Log Out
Выйти
Looks like there aren't any clips to listen to in this language. Help us fill the queue by recording some now.
Кажется, нет никаких записей для прослушивания на этом языке. Помогите нам создать новые, сделав несколько своих.
Macedonian
Македонский
Make your submitted data as rich as possible by providing some anonymous demographic data. We de-identify all demographic data before making it public.
Предоставляя анонимные демографические данные, вы делаете их максимально полными. Мы обезличиваем все демографические данные перед публикацией.
Malayalam
Малаялам
Male
Meez
Maltese
malta čeeli
Manage Email Subscriptions
Управление подписками по эл. почте
Manage Subscriptions
Управление подписками
MB
MB
Meadow Mari
Лугово-восточный марийский
Message
Čirjotuz
Mixed
Смешанная
Moksha
Мокшанский
Mongolian
Монгольский
More
Rohkap
Most of the data used by large companies isn’t available to the majority of people. We think that
stifles innovation. So we’ve launched Common Voice, a project to help make voice recognition open
and accessible to everyone.
Большинство данных, используемых крупными компаниями, недоступны людям. Мы считаем, что это сдерживает инновации. Вот почему мы запустили проект Common Voice, направленный на то, чтобы сделать технологию распознавания голоса открытой и доступной для всех и каждого.
Most of the data used by large companies isn’t available to the majority of people. We think
that stifles innovation. So we’ve launched Project Common Voice, a project to help make voice
recognition open to everyone.
Большинство данных, используемое корпорациями, недоступно для большинства людей. Мы думаем, что это подавляет развитие инноваций. Поэтому мы запустили проект Common Voice, призванный помочь стать распознаванию голоса открытым и доступным для всех и каждого.
Most speech databases are trained with an overrepresentation of certain demographics which results in a bias towards <articleLink>male and middle class</articleLink>. Accents and dialects that tend to be under-represented in training data sets are typically associated with groups of people who are already marginalised. Many machines also struggle to understand female voices.
This is why in our voice database we want variety!
Большинство речевых баз данных обучаются с чрезмерным уклоном к определённым демографическим данным, что приводит к смещению в сторону <articleLink>мужского пола и среднего класса</articleLink>. Акценты и диалекты, которые, как правило, неполно предоставлены в наборах обучающих данных, обычно связаны с группами людей, которые уже изолированы. Многие машины также с трудом понимают женские голоса.
Вот почему в нашей голосовой базе данных мы хотим получить разнообразие!
Mozilla doesn’t pick or favor any one language over another. Instead, Common Voice is a purely community-driven initiative, but it takes <multilangLink>several steps to add a new language</multilangLink> and begin collecting voice donations. First, the Common Voice website needs to be translated so community members can access the contributor experience in their own language. Next, we need a large collection of copyright-free sentences for people to read outloud. Once both of those requirements are satisfied a language is “launched” on Common Voice for people to start recording their voice and validating others donations. If you want to help launch a new language, head over to our <sentenceCollectorLink>sentence collection tool</sentenceCollectorLink> to get started.
Mozilla не выбирает и не предпочитает какой-либо один язык другому. Common Voice — это целиком инициатива сообщества, и для добавления нового языка и начала сбора голосов <multilangLink>необходимо выполнить два шага</multilangLink>. Во-первых, необходимо перевести веб-сайт Common Voice, чтобы участники сообщества могли получить доступ к материалам на своём родном языке. Далее нам понадобится большая коллекция предложений, не ограниченная авторскими правами, чтобы люди могли читать их вслух. Как только оба этих требования будут выполнены, язык в Common Voice перейдёт в статус «запущен», и люди смогут начать записывать свой голос и проверять голоса других людей. Если вы хотите помочь запустить какой-либо язык, перейдите к <sentenceCollectorLink>инструменту для сбора предложений</sentenceCollectorLink> и загрузите какие-либо предложения.
Mozilla is dedicated to keeping the web open and accessible for everyone. To do that we need to empower web creators through projects like Common Voice. As voice technologies proliferate beyond niche applications, we believe they must serve all users equally. That means investing in more languages and accommodating diverse accents and demographics when building and testing voice technologies. Common Voice is a public resource available to everyone and Mozilla teams and developers around the world are already using it on our own projects as well.
Mozilla стремится к тому, чтобы Интернет был открытым для всех и каждого. Для этого нам необходимо расширить возможности веб-разработчиков с помощью таких проектов, как Common Voice. Поскольку голосовые технологии распространяются за пределы нишевых приложений, мы считаем, что они должны одинаково обслуживать всех пользователей. Это означает инвестирование в большее количество языков и учёт различных акцентов и демографии при создании и тестировании голосовых технологий. Common Voice — это общедоступный ресурс, который активно используется командами и разработчиками Mozilla по всему миру в наших собственных проектах.
Mycroft Ai
Mycroft Ai
Mycroft is the world’s first open source assistant.
Mycroft runs anywhere - on a desktop computer, inside an automobile, or on a Raspberry Pi.
Mycroft — первый в мире голосовой помощник с открытым исходным кодом.
Mycroft работает где угодно — на компьютере, в автомобиле или на Raspberry Pi.
n
n
N/A
Недоступно
Name
Nimi
Native Language
Родной язык
Native Language
Родной язык
Nepali
Непальский
Next Goals: { $goal }
Следующая цель: { $goal }
No
Eb
No
Eb
No
Eb
No gravatar found for your email
Данный адрес эл. почты не зарегистрирован в gravatar
No microphone found.
Микрофон не найден.
Norwegian Bokmål
Норвежский Букмол
Norwegian Nynorsk
Норвежский Нюнорск
Note: When set to 'Visible', this setting can be changed from the <profileLink>Profile page</profileLink>
Примечание: Если установлено «Видимый», то этот параметр можно изменить на <profileLink>странице профиля</profileLink>
Note: You will still need to select between Speak or Listen to change contribution type.
Примечание: Вам по-прежнему нужно выбирать между записью и прослушиванием, чтобы изменить тип внесения вклада.
Not found
Страница не найдена
No Thanks
Нет, спасибо
Now you can donate your voice to help us build an open-source voice database that anyone can use
to make innovative apps for devices and the web. Read a sentence to help machines learn how real people speak. Check the work of other
contributors to improve the quality. It’s that simple!
Теперь вы можете отправить нам свой голос, чтобы помочь создать открытую языковую базу данных, которую сможет использовать любой разработчик для создания своих инновационных приложений и сайтов.<lineBreak></lineBreak> Произносите фразы, чтобы помочь машинам понять, как говорят реальные люди. Проверяйте работу других волонтёров, чтобы улучшить качество. Это просто!
{ NUMBER($count) } clips
{ NUMBER($count) } записей
Number of Voices
Количество голосов
{ NUMBER($totalHours) } hours is achievable in just over { NUMBER($periodMonths) }
months if { NUMBER($people) } people record { NUMBER($clipsPerDay) } clips a day.
{ NUMBER($totalHours) } часов достижимо за { NUMBER($periodMonths) }
месяцев, если { NUMBER($people) } людей будут делать { NUMBER($clipsPerDay) } записей в день.
Occitan
Окситанский
Odia
Ория
Off
Выкл.
Offensive language
Оскорбительные выражения
Offensive speech
Оскорбительные выражения
On
Вкл.
On desktop computers, you can download the latest:
На настольных компьютерах, вы можете загрузить последний:
Optionally join on our email list for updates and new information about the project.
При желании присоединяйтесь к нашему списку рассылки для получения обновлений и новой информации о проекте.
Optionally submitted demographic data (e.g. age, sex, language, and accent) is de-identified from your submitted voice data and will never be made public on your profile.
Опционально предоставляемые демографические данные (такие как возраст, пол, язык и акцент) обезличиваются и никогда не будут сделаны публичными в вашем профиле.
or Delete voice clip
или удалить голосовую запись
Other
Tõin
Other Language
Tõisõd čeeled
Other voice datasets…
Другие голосовые наборы данных...
Other Voice Datasets
Другие наборы голосовых данных
Our source text is made up of original contributor donations as well as dialogue from public domain movie scripts like <italic>It’s a Wonderful Life</italic>.
You can view our source sentences in this <githubLink>GitHub folder</githubLink>.
Наш исходный текст состоит из оригинальных пожертвований участников, а также диалогов из сценариев фильмов в общественном достоянии, таких как <italic>Эта замечательная жизнь</italic>.
Вы можете просмотреть наши исходные предложения в этой <githubLink>папке GitHub</githubLink>.
Overall Accuracy
Общая точность
Overall Hr. Total
Часов всего
Overall project status: see how far we’ve come!
Общий статус проекта: посмотрите, как далеко мы ушли!
p
p
Partners
Партнёры
Partners
Партнёры
Persian
Персидский
<playIcon></playIcon>Last one!
<playIcon></playIcon> Последний!
Play/Stop
Воспроизвести/остановить
Polish
Польский
Portuguese
Португальский
Portuguese (Brazil)
Португальский (Бразилия)
Press play, listen & tell us: did they accurately speak the sentence below?
Включите запись, послушайте и расскажите нам: хорошо ли озвучена фраза, расположенная ниже?
Press { shortcut-play-toggle } to toggle play mode
Нажмите { shortcut-play-toggle } для переключения режима воспроизведения
Privacy
Приватность
Privacy Policy
Политика приватности
Pro
Maastõri
Profile
Profili
Profile information improves the audio data used in training speech recognition accuracy.
Информация профиля улучшает точность распознавания аудиоданных.
Progress
Ход выполнения
r
r
Read More
Lugõ rohkap
Read More
Lugõ rohkap
Read more on our About page
Узнайте больше на нашей странице «Meiss»
Ready to do { $count } more?
Готовы сделать ещё { $count }?
Ready to donate your voice?
Готовы пожертвовать свой голос?
Ready to help validate sentences?
Готовы помочь с проверкой предложений?
Recorded Clips
Озвучено
Recorded Hours
Часов записано
<recordIcon></recordIcon> Last one!
<recordIcon></recordIcon>Последний!
Recording
Запись
Recordings
записи
Recording voice clips is an integral part of building our open dataset; some would say it's the fun part too.
Запись озвученных предложений является неотъемлемой частью создания нашего открытого набора данных; некоторые могут считать, что это еще и интересное занятие.
Record/Stop
Записать/остановить
RECORD VOICEWAVE
ЗАПИСАТЬ ПРИВЕТСТВИЕ
Record your voice
Запишите свой голос
Recreate Voicewave
Перезаписать приветствие
Remove
Удалить
Report
Пожаловаться
Report was passed successfully
Жалоба была успешно отправлена
Request a Language
Запросить язык
*required
*обязательно
Re-record
Перезаписать
RE-RECORD
ПЕРЕЗАПИСАТЬ
Re-record clip
Перезаписать клип
RETRY
ПОВТОРИТЬ
Return here to edit your goal anytime.
Возвращайтесь сюда, чтобы изменить свою цель в любое время.
Return to Common Voice
Takaz Common Voice tüvve
Return to Common Voice Datasets
Вернуться к наборам данных Common Voice
Return to Languages
Takaz čeelte tüvve
Review
Проверить
Review & re-record clips here as you go
Проверьте и перезапишите клипы здесь
Review & re-record clips if needed
Проверьте и перезапишите клипы при необходимости
Review & Submit
Проверить и отправить
Romanian
Румынский
Romansh Sursilvan
Романшский Сурсельвский
Romansh Vallader
Романшский Валладер
Russian
Vennä
Russian
Vennä
s
s
Sakha
Якутский
Sardinian
Сардинский
Save
Сохранить
Saved
Сохранено
Search
Etsi
Search for answers
Поиск ответов
See how your progress compares to other contributors all over the world.
Наблюдайте, как ваш прогресс сравнивается с другими участниками по всему миру.
See Less
Näe vähep
See More
Näe rohkap
Select a Language...
Valitsõ čeeli...
Sentence Collection
Коллекция фраз
Sentences
Предложения
Serbian
Сербский
Set a goal
Поставить цель
Set my visibility
Установите мою видимость
Settings
Настройки
Sex
Suku
Share my goal
Поделиться моей целью
Share your { $count } Clip Daily Goal for { $type }
Поделитесь свой целью { $count } записей в день для { $type }
Share your { $count } Clip Weekly Goal for { $type }
Поделитесь своей целью { $count } записей в неделю для { $type }
Shortcuts
Сочетания клавиш
Show my ranking
Показать мой рейтинг
Sign up for an account
Tuõ čäüttäjässi
Sign up for Common Voice newsletters, goal reminders and progress updates
Saattõga millõ uutisjuttua Common Voice progressass
sign up for email updates
Подписаться на рассылку обновлений
Sign up for { $lang } updates:
Подпишитесь и будьте в курсе, как обновляется { $lang } язык:
Sinhala
Сингальский
Size
Размер
Skip
Пропустить
Skip Submission Feedback
Пропустить оценку работы
Slovak
Словацкий
Slovenian
Словенский
Sorbian, Lower
Нижнелужицкий
Sorbian, Upper
Верхнелужицкий
Spanish
Испанский
Speak
Pajatõ
Speak
Говорите
Speak
Pajatõ
Speakers
Pajatõjõd
Speaking
Pajattõmin
Speaking and Listening
Pajattõmin i kuuntõmin
Speak now
Pajatõ nütt
Speak now
Pajatõ nütt
Speak up, contribute here!
Помогите нам, сделав запись своего голоса!
<speechBlogLink>Get Started with Speech Recognition</speechBlogLink>
<speechBlogLink>Начать работу с распознаванием речи</speechBlogLink>
Speech is often the most natural way we communicate with each other and voice technologies are bringing that convenience to our computers and mobile devices. We want to empower developers to build amazing voice recognition applications like real-time translators and voice-enabled digital assistants. But right now most of the voice data required to build these kinds of apps is expensive and proprietary. We hope the Common Voice dataset will give developers what they need to innovate and make speech technology available in their own language.
To make voice recognition even more universal, we're collecting voice samples in widely spoken languages as well as those with a smaller population of speakers often underserved by commercial speech recognition services. Publishing a diverse dataset of voices will empower developers, entrepreneurs, and entire speech communities to address this gap themselves.
Речь — наиболее естественный способ общения между людьми, а применение голосовых технологий в наших компьютерах и мобильных устройствах является очень удобным. Мы хотим дать возможность разработчикам создавать продвинутые приложения для распознавания голоса, такие как переводчики в реальном времени и цифровые помощники с поддержкой голоса. Но сейчас большая часть голосовых данных, необходимых для создания приложений такого типа, является дорогой и запатентованной. Мы надеемся, что набор данных Common Voice даст разработчикам то, что им нужно для инноваций и сделает речевые технологии доступными на своём родном языке.
Чтобы сделать распознавание голоса ещё более универсальным, мы собираем образцы голоса на широко распространенных языках, а также образцы с меньшим количеством говорящих, которые часто недооцениваются коммерческими службами распознавания речи. Публикация разнообразных наборов голосов позволит разработчикам, предпринимателям и целым речевым сообществам самим устранить этот пробел.
Speech-to-text (STT)
Речь в текст (Speech-to-text, STT)
Speech-to-text (STT) technologies convert voice data into text.
Технология Speech-to-text (STT) преобразовывает голосовые данные в текст
Splits
Разделение
Start recording
Начните запись
Stats
Статистика
Streaks
Дней подряд
Submit
Saatõ
Submit
Saatõ
Submit
Saatõ
Submit
Saatõ
Submit a report
Отправить жалобу
Submit clips
Отправить клипы
Subscribe
Подписаться
Success
Готово
Success, profile created!
Отлично, профиль создан!
Swahili
Суахили
Swedish
švietta
Swedish
švietta
Syriac
Сирийский
Tajik
Таджикский
Tamil
Тамильский
Tap
Коснуться
Tatar
Татарский
Tatoeba is a large database of sentences, translations, and spoken audio for use in language learning. This download contains spoken English recorded by their community.
Tatoeba — это большая база данных предложений, переводов и разговорного аудио для использования в изучении языка. Эта загрузка содержит разговорный английский язык, записанный их сообществом.
TED-LIUM Corpus
Собрание TED-LIUM
Telugu
Телугу
Terms
Условия
Thai
Тайский
Thanks for confirming your account, now let's build your profile.
Спасибо за подтверждение вашего аккаунта, теперь давайте заполним ваш профиль.
Thank you for recording!<lineBreak></lineBreak>Now review and submit your clips below.
Спасибо за запись!<lineBreak></lineBreak>Теперь проверьте и отправьте ваши записи ниже.
Thank you for your interest in contributing to { $lang }. We work hard to get every language ready for launch and keep
the teams updated via email. If you want to contribute, please provide your email below.
Спасибо за ваш интерес во внесение вклада в { $lang } язык. Мы усердно работаем над тем, чтобы подготовить каждый язык к запуску, и держим связь с участниками по электронной почте. Если вы хотите внести вклад, то укажите внизу свой адрес электронной почты.
The Clip Graveyard consists of voice clips that didn't make it into the Common Voice dataset. Just like the dataset, the Clip Graveyard is available for download.
«Кладбище записей» состоит из голосовых записей, которые не вошли в голосовой набор Common Voice. Также как и основной набор, набор «Кладбища записей» тоже доступен для загрузки.
The clip has disrespectful or offensive language.
Запись содержит дискриминационные или оскорбительные выражения.
The Common Voice dataset complements Mozilla’s open source voice recognition engine Deep Speech. The first version of Deep Speech was released in November 2017 and has continued to evolve ever since. Together with the Common Voice dataset, we believe this open source voice recognition technology should be available to everybody. It’s our hope these technologies will enable developers to build a wave of innovative products and services.
Набор данных Common Voice дополняет движок распознавания голоса с открытым исходным кодом Mozilla Deep Speech. Первая версия Deep Speech была выпущена в ноябре 2017 года и с тех пор продолжает развиваться. Вместе с набором данных Common Voice мы считаем, что эта технология распознавания голоса с открытым исходным кодом должна быть доступна каждому. Мы надеемся, что эти технологии позволят разработчикам создать массу инновационных продуктов и услуг.
The Common Voice dataset complements Mozilla’s open source voice recognition engine Deep Speech, which you can use to build speech recognition applications. Read our <githubLink>Github overview</githubLink> or join the <discourseLink>DeepSpeech Discourse</discourseLink> to learn how to get started.
Набор данных Common Voice дополняет открытый движок распознавания речи Deep Speech от Mozilla, который вы можете использовать при создании своих приложений. Прочитайте наш <githubLink>обзор на GitHub</githubLink> или присоединитесь к <discourseLink>разделу DeepSpeech на форуме Discourse</discourseLink>, чтобы узнать, как начать работу.
The Common Voice Dataset contains hundreds of thousands of voice samples that help developers build voice recognition tools.
Набор данных Common Voice содержит сотни тысяч образцов голосов, которые помогают разработчикам создавать инструменты распознавания голоса.
The Common Voice dataset is an open and publicly available resource that can be used to train a wide variety of speech-enabled applications. To protect the security of our contributors, we ask everyone who downloads the Common Voice dataset to respect contributors’ privacy.
All voice clips in the dataset are scrubbed of personally identifying information. When you download the dataset, you agree to not attempt to determine the identity of any contributor. That means you cannot try to link information in the dataset to a contributor’s personal information. You may, however, use the dataset to train speech recognition, speaker recognition, or other applications, by, for instance, linking information in the dataset to other information already in the dataset.
Набор данных Common Voice - это открытый и общедоступный ресурс, который можно использовать для обучения самых различных приложений с поддержкой речи. Чтобы обеспечить безопасность наших участников, мы просим всех, кто загружает набор данных Common Voice, соблюдать конфиденциальность участников.
Все голосовые записи в наборе данных очищаются от личной информации. Загружая набор данных, вы соглашаетесь не пытаться определить личность какого-либо участника. Это означает, что вы не можете пытаться связать информацию в наборе данных с личной информацией участника. Однако вы можете использовать набор данных для обучения распознаванию речи, распознаванию говорящего или других приложений, например, связывая информацию в наборе данных с другой информацией, уже имеющейся в наборе данных.
The Common Voice dataset is available for download under the <licenseLink>CC0</licenseLink> license on <datasetLink>our Datasets page</datasetLink>. You can also download several other publicly available datasets from the same page.
Набор данных Common Voice доступен для загрузки по лицензии <licenseLink> CC0 </ licenseLink> на <datasetLink> нашей странице наборов данных </ datasetLink>. Вы также можете загрузить несколько других общедоступных наборов данных с той же страницы.
The count of voice recording hours that have been validated by 2 out of 3 users with a vote of “Yes”. These mark progress toward the overall project 10k hours goal.
Количество часов записи голоса, которые были подтверждены 2 из 3 пользователей с голосом «Да». Прогресс в достижении общей цели проекта в 10k часов.
The count of voice recording hours we have collected so far.
Количество часов записи голоса, которое мы собрали на данный момент.
The goal of the Common Voice dataset is to enable anyone in the world to build speech recognition, speaker recognition, or any other type of application that requires voice data. A voice assistant is just one of many types of applications you could use the dataset to build.
Цель набора данных Common Voice состоит в том, чтобы дать возможность любому человеку в мире создавать распознавание речи, распознавание говорящего или любое другое приложение, для которого требуются голосовые данные. Голосовой помощник — это только один из множества типов создаваемых приложений, для которого вы можете использовать набор данных.
The multi-language version of the Common Voice dataset is currently undergoing community supported bundling and cleaning. If you would like to help us bring Common Voice to new languages, go check out the <sentenceCollectorLink>Sentence Collection Tool</sentenceCollectorLink> for adding new sentences to the dataset, and Mozilla <pontoonLink>Pontoon</pontoonLink> for translating the website itself. New languages are added to Common Voice for voice contribution when 5000 approved sentences have been collected.
Мультиязычная версия набора данных Common Voice в настоящее время проходит объединение и валидацию при поддержке сообщества. Если вы хотите помочь нам перевести Common Voice на новые языки, перейдите на страницу <sentenceCollectorLink>инструмента для сбора предложений</sentenceCollectorLink> для добавления новых предложений в набор данных и Mozilla <pontoonLink>Pontoon</pontoonLink> для перевода самого веб-сайта. Новые языки добавляются в Common Voice, когда собирается 5000 утверждённых предложений.
The multi-language version of the Common Voice dataset is currently undergoing community supported bundling and cleaning. If you would like to learn more about supporting this effort, please <contactLink>contact us</contactLink>. We are currently targeting a publish date of January 2019. After that, we’ll update the dataset periodically with new languages and voice clips as they become available. An iterative release cycle cadence is still to be determined.
Многоязычная версия набора данных Common Voice в настоящее время проходит обработку и очистку при поддержке сообщества. Если вы хотите узнать больше о том, как можно помочь, пожалуйста, <contactLink>свяжитесь с нами</contactLink>. В настоящее время мы ориентируемся на дату публикации — январь 2019 года. После этого мы будем периодически обновлять набор данных новыми языками и голосовыми записями по мере их появления. Частота повторения цикла повторного выпуска ещё не определена.
The number of recordings and which languages you contribute to will be public.
Количество сделанных вами записей и их языки будут публично доступны.
The process by which a contributor’s profile information is obscured from their donated voice clips when packaged for download as a part of the dataset.
Процесс, с помощью которого информация профиля участника убирается из пожертвованных им голосовых записей, когда они упаковываются для загрузки, как часть набора данных.
The recording was too long.
Запись слишком длинная.
The recording was too quiet.
Запись слишком тихая.
The recording was too short.
Запись слишком короткая.
These languages are currently under community development. The progress bars indicate how far each language is in the process of <localizationGlossaryLink>website localization</localizationGlossaryLink> and <sentenceCollectionGlossaryLink>sentence collection</sentenceCollectionGlossaryLink>.
Эти языки в настоящее время находятся на стадии развития сообществом. Индикаторы прогресса отображают, насколько далеко для каждого языка продвинулся процесс <localizationGlossaryLink>локализации веб-сайта </localizationGlossaryLink> и <sentenceCollectionGlossaryLink>сбора предложений</sentenceCollectionGlossaryLink>.
The selected file is too large
Выбранный файл имеет слишком большой размер
The sentence has a grammatical or spelling error.
Предложение содержит грамматическую или орфографическую ошибку.
The sentence has disrespectful or offensive language.
Предложение содержит дискриминационные или оскорбительные выражения.
The TED-LIUM corpus was made from audio talks and their transcriptions available on the TED website.
Собрание TED-LIUM было создано из аудио переговоров и их транскрипций, доступных на сайте TED.
This is approximately the number of hours required to train a production speech-to-text system.
Это примерное количество часов, необходимое для обучения рабочей системы преобразования речи в текст.
This is open source software which can be freely remixed, extended, and improved. Mycroft may be used in anything from a science project to an enterprise software application.
Это программное обеспечение с открытым исходным кодом, которое можно свободно изменять, расширять и улучшать. Mycroft может использоваться в любой отрасли, от научного проекта до корпоративного программного обеспечения.
This is our process for translating and adapting our content for many locales (languages).
Это наш процесс перевода и адаптации нашего контента для многих языков.
This setting controls your leaderboard visibility. When hidden, your progress will be private. This means your image, user name and progress will not appear on the leaderboard. Note that leaderboard refresh takes ~{ $minutes }min to populate changes.
Этот параметр контролирует вашу видимость в топе. Когда вы скрыты, ваш прогресс будет приватным. Это означает, что ваше изображение, имя пользователя и прогресс не будут отображаться в списке лидеров. Обратите внимание, что обновление списка лидеров занимает примерно { $minutes } минут.
Three to go!
Осталось три!
Today
Tänävä
Today's Common Voice progress on clips recorded
Сегодня сделано записей на Common Voice
Today's Common Voice progress on clips validated
Сегодня проверено записей на Common Voice
Today's Progress
Tämä päivä progressõ
To make it into the Common Voice dataset, a voice clip must be validated by two separate users.
Чтобы попасть в набор данных Common Voice, запись должна быть проверена двумя разными пользователями.
To make the Common Voice dataset as useful as possible we have decided to only allow source text that is available under a Creative Commons (CC0) license. Using the CC0 standard means its more difficult to find and collect source text, but allows anyone to use the resulting voice data without usage restrictions or authorization from Mozilla. Ultimately, we want to make the multi-language dataset as useful as possible to everyone, including researchers, universities, startups, governments, social purpose organizations, and hobbyists.
Чтобы сделать набор данных Common Voice как можно более полезным, мы решили разрешить использовать только исходный текст, доступный по лицензии Creative Commons (CC0). Использование стандарта CC0 означает, что исходный текст труднее найти и собрать, но в то же время это позволяет любому использовать полученные голосовые данные без ограничений использования или разрешений от Mozilla. В конечном счёте, мы хотим сделать набор многоязычных данных максимально полезным для всех, включая исследователей, университеты, стартапы, правительства, организации социального назначения и любителей.
Top Contributors
Топ помощников
Total
Ühtee
Total Approved
Всего проверено
Toward next goal
Следующая цель
Track progress here and on your stats page.
Отслеживайте свой прогресс здесь и на странице статистики.
Turkish
Турецкий
Ubykh
Убыхский
Udmurt
Удмуртский
Ukrainian
Украинский
Unable to speak right now?
Не в состоянии говорить прямо сейчас
Upload
Laadi ülelle
Upload aborted. Do you want to delete your recordings?
Загрузка прервана. Хотите ли вы удалить ваши записи?
Upload an image file
Загрузить файл изображения
Urdu
Урду
User Name
Имя пользователя
Users validate the accuracy of donated clips, checking that the speaker read the sentence correctly.
Пользователи проверяют точность пожертвованных записей, правильно ли говорящий озвучил предложение.
Using Common Voice
Использование Common Voice
Uzbek
Узбекский
Validated Clips
Проверено
Validated Hours
Часов проверено
Validated Hrs
Всего часов
Validated Hr. Total
Всего часов проверено
Validating donated clips is equally important to the Common Voice mission. Take a listen and help us create quality open source voice data.
Проверка добавленных записей очень важна для миссии Common Voice. Послушайте записи и помогите нам создать качественные открытые голосовые данные.
Validations
проверки
Version
Версия
Vietnamese
Вьетнамский
View your progress against personal and project goals.
Наблюдайте свой прогресс в достижении личных и проектных целей.
Visible
Видимый
Voice clips are entered into a submission queue that readies them for listening.
Голосовые записи попадают в очередь на проверку, после которой они будут прослушаны.
Voice is natural, voice is human. That’s why we’re excited about creating usable voice technology
for our machines. But to create voice systems, developers need an extremely large amount of voice
data.
Голос — естественен и человечен. Вот почему мы с большим интересом создаем пригодную к использованию машинами голосовую технологию. Но для создания систем распознавания голоса необходим очень большой объём голосовых данных.
Voice is natural, voice is human. That’s why we’re fascinated with creating usable voice
technology for our machines. But to create voice systems, an extremely large amount of voice
data is required.
Голос - естественен, голос - человечен. Вот почему мы стремимся создать удобную языковую технологию для наших машин. Но чтобы создавать голосовые системы, требуется очень большой объём языковых данных.
Voice recognition technology is revolutionizing the way we interact with machines, but the currently available systems are expensive and proprietary. Common Voice is part of Mozilla’s initiative to make voice recognition technologies better and more accessible for everyone. Common Voice is a massive global database of donated voices that lets anyone quickly and easily train voice-enabled apps in potentially every language.
We're not only collecting voice samples in widely spoken languages but also in those with a smaller population of speakers. Publishing a diverse dataset of voices will empower developers, entrepreneurs, and communities to address this gap themselves. In addition to the Common Voice dataset, we’re also building an open source speech recognition engine called Deep Speech.
Технология распознавания голоса революционизирует способ взаимодействия с машинами, но доступные в настоящее время системы являются дорогостоящими и запатентованными. Common Voice является частью инициативы Mozilla, направленной на то, чтобы сделать технологии распознавания голоса лучше и доступнее для всех. Common Voice - это обширная глобальная база данных пожертвованных голосов, которая позволяет любому быстро и легко обучать голосовые приложения практически на любом языке.
Мы собираем не только образцы голоса на широко распространенных языках, но и на языках с меньшим количеством говорящих. Публикация разнообразных наборов голосов позволит разработчикам, предпринимателям и сообществам самим устранить этот пробел. В дополнение к набору данных Common Voice мы также создаем механизм распознавания речи с открытым исходным кодом под названием Deep Speech.
Voice recording in progress
Идёт запись голоса
Voices Online Now
Äänte paraikaa onlainiz
Votic
vad̕d̕a
VoxForge was set up to collect transcribed speech for use with Free and Open Source Speech Recognition Engines.
VoxForge был создан для сбора транскрибированной речи для использования со свободными и открытыми механизмами распознавания речи.
Want to change your voice clip?
Хотите изменить свою голосовую запись?
Want to help make Common Voice even better?
Great! Get in touch via email or on <discourseLink>Discourse</discourseLink>,
submit feedback through <githubLink>GitHub</githubLink>,
or join us on <slackLink>Slack</slackLink>.
Хотите помочь сделать Common Voice ещё лучше?
Отлично! Свяжитесь с нами по электронной почте или на <discourseLink>Discourse-форуме</discourseLink>,
оставьте отзыв на <githubLink>GitHub</githubLink>,
или присоединитесь к нам на <slackLink>Slack</slackLink>.
Want updates when we release a new version of the Common Voice dataset? Subscribe to our newsletter.
Хотите получить сообщение о выпуске новой версии набора данных Common Voice? Подпишитесь на нашу новостную рассылку.
We are building an open and publicly available dataset of voices that everyone can use to train speech-enabled applications.
Мы создаём открытый и общедоступный набор голосовых данных, чтобы любой человек мог использовать его для обучения программ с распознаванием речи.
We at Mozilla are building a community around voice technology. We would like to stay in touch with updates, new data sources and to hear more about how you're using this data.
Мы в Mozilla создаём сообщество по языковым технологиям. Мы хотим, чтобы вы были в курсе всех новостей, новых источников данных, а также хотели бы знать больше о том, как вы используете такого рода данные.
We at Mozilla are building a community around voice technology. We would like to stay in touch with updates, new data sources and to hear more about how you're using this data.
Мы в Mozilla создаём сообщество по языковым технологиям. Мы хотим, чтобы вы были в курсе всех новостей, новых источников данных, а также хотели бы знать больше о том, как вы используете такого рода данные.
We believe that large and publicly available voice datasets foster innovation and healthy commercial competition in machine-learning based speech technology. This is a global effort and we invite everyone to participate. Our aim is to help speech technology be more inclusive, reflecting the diversity of voices from around the world.
Мы верим, что большой общедоступный набор голосовых данных стимулирует инновации и нормальную коммерческую конкуренцию в машинно-обучаемой технологии распознавания голоса. Это глобальная инициатива, и мы приглашаем всех принять участие. Наша цель - помочь голосовым технологиям быть более всесторонними и распознавать разнообразные голоса со всего мира.
We believe that large, publicly available voice datasets will foster innovation and healthy commercial competition in machine-learning based speech technology.
Common Voice’s multi-language dataset is already the largest publicly available voice dataset of its kind, but it’s not the only one.
Look to this page as a reference hub for other open source voice datasets and, as Common Voice continues to grow, a home for our release updates.
Мы считаем, что большие и общедоступные наборы голосовых данных будут способствовать появлению нововведений и здоровой коммерческой конкуренции в области речевых технологий на основе машинного обучения.
Мультиязычный набор данных Common Voice уже является крупнейшим общедоступным набором голосовых данных, но он не единственный в своем роде.
На этой странице вы можете найти ссылки на другие открытые наборы голосовых данных и, с развитием Common Voice, обновления наших выпусков.
We calculate hours by estimating the average length of each recording, and then multiplying that number by the total number of recordings across all languages.
Мы вычисляем часы, оценивая среднюю длину каждой записи, а затем умножая это число на общее количество записей на всех языках.
We don't have anything to validate in this language, help us fill the queue.
У нас нет ничего для проверки на этом языке, помогите нам заполнить очередь.
Weekly
Nätälitta
Weekly Goal
Еженедельная цель
Welcome { $company } staff!
Добро пожаловать, сотрудники { $company }!
Welsh
Валлийский
We promise to handle your information with care. Read more in our <privacyLink>Privacy Notice</privacyLink>.
Мы обещаем, что будем обрабатывать вашу информацию с осторожностью. Подробнее в нашей <privacyLink>политике приватности</privacyLink>.
We promise to handle your information with care. Read more in our <privacyLink>Privacy Notice</privacyLink>.
Мы обещаем, что будет обрабатывать вашу информацию с осторожностью. Подробнее в нашей <privacyLink>политике приватности</privacyLink>.
We’re building an open source, multi-language dataset of voices that anyone can use to train speech-enabled applications.
Мы создаём открытый и мультиязычный набор голосовых данных, который любой желающий сможет использовать для обучения голосовых приложений.
We’re crowdsourcing an open-source dataset of voices. Donate your voice, validate the accuracy of other people’s clips, make the dataset better for everyone.
Мы создаём краудсорсинговый открытый голосовой набор. Помогите своим голосом, проверяйте точность записей других людей, делайте набор данных лучше для всех и каждого.
We’re sorry, but your platform is not currently supported.
Нам жаль, в настоящее время ваша платформа не поддерживается.
We want the Common Voice dataset to reflect the audio quality a speech-to-text engine will hear in the wild, so we’re looking for variety. In addition to a diverse community of speakers, a dataset with varying audio quality will teach the speech-to-text engine to handle various real-world situations, from background talking to car noise. As long as your voice clip is intelligible, it should be good enough for the dataset.
Мы хотим, чтобы набор данных Common Voice работал с качеством звука, которое движок преобразования речи в текст будет слышать в реальной жизни, поэтому нам необходимо разнообразие. В дополнение к широкому сообществу авторов записей, набор данных с различным качеством звука научит движок распознавания речи правильно работать в различной среде, например, с фоновыми разговорами и автомобильными шумами. Если ваша запись понятна, то она нужна для набора данных.
We will be in touch with more information about how to add your language to Common Voice very soon.
Мы максимально быстро свяжемся с вами, рассказав о том, как добавить ваш язык в Common Voice.
We will be in touch with more information as it becomes available.
Мы свяжемся с вами, сообщив больше информации, когда она станет доступна.
We will not make your email public.
Мы не будем публиковать вашу электронную почту.
We will review your request to remove your voice recordings from the dataset. If your request is approved, we will contact those who have downloaded the dataset and request they remove your voice recordings as well.
Мы рассмотрим ваш запрос на удаление ваших голосовых записей из набора данных. Если ваш запрос будет одобрен, мы свяжемся с теми, кто загрузил этот набор данных, и попросим их удалить ваши записи голоса.
What does it mean that I can’t “determine the identity” of speakers in the Common Voice dataset?
Что это значит, что я не могу «определить личность» ораторов в наборе данных Common Voice?
What is Common Voice?
Mikä on Common Voice?
What is Common Voice?
Mikä on Common Voice?
What issues are you experiencing with this sentence?
Какие проблемы вы испытываете с этим предложением?
What level of audio quality is required for a voice clip to be used in the dataset?
Какого качества требуется звук для голосового клипа, который будет использоваться в наборе данных?
What’s inside the Common Voice dataset?
Что находится внутри набора данных Common Voice?
What's Public?
Какие данные доступны всем?
What’s the difference between Common Voice and Deep Speech?
В чем разница между Common Voice и Deep Speech?
When a user rejects a voice clip it returns to the Queue. If rejected a second time, the voice clip is moved to the Clip Graveyard.
Если пользователь выбирает «Нет», запись возвращается в очередь. Если она получает второй голос «против», то запись отправляется на «Кладбище записей».
When will you release Common Voice data in other languages?
Когда вы выпустите данные Common Voice на других языках?
When will you release Common Voice data in other languages?
Когда вы выпустите набор данных Common Voice на других языках?
Where does the source text come from?
Откуда берутся тексты для озвучивания?
Why ?
Почему?
Why a profile?
Зачем нужен профиль?
Why Common Voice?
Почему Common Voice?
Why does this matter?
Почему это важно?
Why don’t you ask people to read from books or Wikipedia articles in different languages?
Почему бы вам не попросить людей читать книги или статьи из Википедии на разных языках?
Why do you need so many different speakers per language?
Зачем вам так много разных носителей одного языка?
Why is 10,000 validated hours the per language goal for capturing audio?
Почему 10000 проверенных часов является языковой целью для захвата звука?
Why is Common Voice part of the Mozilla mission?
Почему Common Voice является частью миссии Mozilla?
Why is it important?
Почему это важно?
Why is my language not included yet?
Почему мой язык ещё не добавлен?
Why should I sign up for an account?
Почему я должен зарегистрироваться?
Would you like to request your voice recordings be deleted too, or do you prefer to keep them in the Common Voice dataset?
Вы хотите, чтобы ваши голосовые записи также были удалены, или вы хотите оставить их в наборе данных Common Voice?
y
y
Yes
Daa
Yes
Jaa
Yes
Daa
Yes, send me emails. I’d like to stay informed about the Common Voice Project.
Daa, saattõka millõ epošti. Я хочу быть в курсе новостей проекта Common Voice.
Yes, send me emails. I'd like to stay informed about the progress of this language on Common Voice.
Daa, saattõka millõ epošti. Я хочу быть в курсе новостей о прогрессе этого языка на Common Voice.
Yes, we especially want your voice! Part of the aim of Common Voice is to gather as many different accents as possible so that voice recognition services work equally well for everyone. This means donations from non-native speakers are particularly important.
Да, мы особенно хотим ваш голос! Часть миссии Common Voice — собрать как можно больше различных акцентов, чтобы службы распознавания голоса работали одинаково хорошо для всех и каждого. Это означает, что вклады не носителей языка особенно важны.
You
Вы
You are about to initiate a download of <size>{ $size }GB</size>, proceed?
Вы собираетесь совершить загрузку <size>{ $size } ГБ</size>, продолжить?
You are prepared to initiate a download of <b>{ $size }</b>
Вы собираетесь совершить загрузку <b>{ $size }</b>
You can choose to make your username public or anonymous.
Вы можете сделать свое имя пользователя публичным или анонимным.
You can help build a diverse, open-source dataset by creating a Common Voice profile and contributing your voice.
Вы можете помочь в создании разнообразного и открытого набора данных, создав профиль Common Voice и помогая своим голосом.
You must allow microphone access.
Вы должны разрешить доступ к микрофону.
Your anonymous voice recordings will remain in the Common Voice dataset. Once you delete your profile you will no longer be able to submit a request to remove your recordings from the dataset
Ваши анонимные записи голоса останутся в наборе данных Common Voice. После удаления вашего профиля вы больше не сможете отправить запрос на удаление ваших записей из набора данных
Your avatar now includes a voice clip!
У вашего аватара теперь есть голос!
Your daily goal has been created
Ваша дневная цель была создана
Your download has started.
Ваша загрузка началась.
You're currently set to <bold>NOT</bold> receive emails such as goal reminders, my
progress updates and newsletters about Common Voice
Вы <bold>НЕ</bold> будете получать такие письма, как напоминания о целях, уведомления о достижениях и новости о Common Voice.
You're currently set to receive emails such as goal reminders, my
progress updates and newsletters about Common Voice
Вы будете получать такие письма, как напоминания о целях, уведомления
о своих достижениях и новости о Common Voice.
Your Languages
Ваши языки
Your username and email will not be associated with the published data.
Ваше имя пользователя и адрес электронной почты не будут связаны с опубликованными данными.
Your weekly goal has been created
Ваша недельная цель была создана
You've helped Common Voice reach <goalPercentage></goalPercentage> of our daily { $goalValue } recording goal!
Вы помогли Common Voice достичь <goalPercentage></goalPercentage> из нашей ежедневной цели по записи в { $goalValue }!
You've helped Common Voice reach <goalPercentage></goalPercentage> of our daily { $goalValue } validation goal!
Вы помогли Common Voice достичь <goalPercentage></goalPercentage> из нашей ежедневной цели по проверке в { $goalValue }!
You've successfully signed up for contributing to { $language }. Thank you.
Вы успешно зарегистрировались, чтобы помочь внести вклад в { $language } язык. Спасибо.