MAX
Подпишись
стань автором. присоединяйся к сообществу!
Есть метка на карте 07 июля 11
51

Российская технология позволит хранить 1,5 часа разговора в 1 МБ

Сейчас в 1 МБ без сжатия хранится примерно 10 минут разговора. Новая технология позволит записать в 9 раз больше

Компания Speereo из Санкт-Петербурга, которая недавно разработала «конкурента Siri», заявила о создании технологии рекордного сжатия голосовых данных. В 1 МБ она позволяет хранить 1,5 часа разговора, что сделает возможным реализацию «поправок Яровой», сообщают «Известия».

В Speereo в рамках Национальной технологической инициативы (НТИ) специально для снижения расходов на хранение голосовых данных разработали технологию, которая позволяет записывать 1,5 часа общения в 1 МБ. Ранее операторы подсчитали, что для выполнения норм закона необходимо записывать и хранить 157,5 эскзабайт данных ежегодно, стоить это будет 4-5,2 трлн рублей. Новая технология уменьшит эти цифры в 9 раз.

Особенностей технологии разработчики не раскрывают, однако отмечают, что в рамках НТИ обсуждается также создание национальной биометрической платформы. Она тоже будет хранить значительные объемы информации, в том числе аудиоданные.

[читать статью полностью...]

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в наш Телеграм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

Источник: hi-tech.mail.ru

Поделись позитивом в своих соцсетях

Комментарии 0

Для комментирования необходимо войти на сайт

  • 3
    Нет аватара guest07.07.16 22:27:31

    Когда речь идет о больших цифрах от PR-менеджеров хочется взять в руки калькулятор. Сделаем предварительно 2 допущения: 1) в РФ 150 млн. реальных активных абонентов 2) каждый абонент беспрерывно 24 часа в сутки 365 дней в году говорит по сотовому телефону (8760 часов в год). Необходимо как-то хранить в оцифрованном виде этот объем.(всеми остальными данными(сообщения, ссылки на получаемые и передающиеся файлы и вся прочая специальная информация) пренебрежем). Дальше следует подумать о том, что представители операторов не будут идиотами и так как большинство звонков идет с территории РФ на территорию РФ они договорятся между собой писать каждый звонок только 1 раз(а не на каждом конце). Эти размышления позволят наши 150 млн. поделить на 2 и получить 75 млн непрерывно ведущихся записей.

    Воспользуемся технологией из статьи: 8760 часов / 1.5 = 5840Мб в год. Вспомним о данных, которыми мы пренебрегли, и на всякий случай, округлим это число до 6Гб. Это 2 человека на год. 340 человек займут уже 1Тб дискового пространства(немного меньше, но опять же округлим до большего) Наши 150 млн. пользователей наговорят на 441 176 Тб, или 430 Пб, или 0.43 Эб. Отличия от заявленных операторами (по данным в статье) 157.5 Эб — _3_ порядка. Ну, а если вернуться к нашим допущениям и осознать, что принципиально невозможно разговаривать 24\7\365 и в среднем в лучшем случае будет 2.4\7\365 и реальных абонентов существенно меньше… То может набежать еще 2 порядка и появятся мысли о том, что операторы что-то капитально не договаривают))

    5 Порядков разницы в объемах… Можно даже совсем условно, на совершенно дилетантском уровне уровне, прикинуть стоимости. Приличный 8 Тб накопитель стоит например 28тыс. рублей в рознице. 5 порядков(я не знаю сколько стоит серверное оборудование). Значит, нам нужно 4.3Пб. Это 540 таких накопителей. Получается 15 млн. рублей. Возьмем еще двухкратное резервирование. 30 млн руб. Конечно, нужны чудовищные вычислительные мощности, дополнительное оборудование для объединения всего этого в единую систему, резервирование, работа сотрудников, программистов, расходы на инфраструктуру и коммуналку. Но, тем не менее. Но это так. просто математика, если я нигде не ошибся) 4.3Пб и 30млн руб и 150Эб и 5 трлн руб.

    Кстати, похоже цифры вполне коррелируют друг с другом) Значит менеджеры действительно прикидывали суммы исходя из весьма странных 150млн и 7\24\365)

    • -2
      Нет аватара 50703308.07.16 05:16:28

      Ну это видимая часть.

      ПРо обслуживание забыли? Технику надо обслуживать, охлаждать. Это люди, кондиционеры, сооружения, сетевая инфраструктура.

      Вот бы в этот проект поместить железки типа Эльбрус. Чтобы и вашим, и нашим.

    • 2
      Павел Дурнов Павел Дурнов08.07.16 10:53:08

      А по стоимости хранения разговоров, возьмем 140 млн. абонентов, так-как операторы не идиоты, то договорятся хранить запись только на одной стороне, в среднем каждый абонент в день имеет менее 2х часов разговора. 10 часов в неделю, 40 часов в месяц, 240 часов за полгода, каждый час с нормальной компрессией занимает 10 Мб. 2,5Гб на абонента. 350 000 000 Гб=350 000 Тб. Теперь делим на два(ведь в разговоре участвует сразу два абонента) 175 000 Тб хранения на всех операторов включая сотовую, проводную и IP телефонию. Условно разделим на 5 (Ростелеком, Мегафон, Билайн, МТС, Теле2) 35 000 Тб на оператора.

      Дальше способ хранения ленточная библиотека или RAID HDD.

      Рассмотрим более дорогой вариант с SAS HDD RAID Level 60 (нахрена такое резервирование я не знаю, но пусть будет), строим на 3,5″ HDD, 6Тб в розницу 20 т.р.

      Один сервер 4U 48HDD хранит 132 Тб при условии сборки RAID 60, стоимость самого сервера(без ПО) 600 000 р. + 960 000 р. стоимость дисков. Таких серверов надо 260 штук. Итого 390 млн. рублей, ну пусть стоимость шкафов, монтажа и пр. еще 110 млн. Итого 0,5 млрд. рублей.

      При использовании этого же оборудования, но в режиме RAID 6, делим стоимость оборудования на 2. 200+110= 310 млн.

      Одна ленточная библиотека HP StoreEver стандарта LTO-6/7 обеспечивает хранение 150Тб в нативном режиме стоит 700 000 руб. 240 библиотек, итого 168 млн. рублей, монтаж настройка и пр, ну пусть как и в версии с дисковыми массивами будет 110 млн. ИТОГО: 280 млн. рублей.