Компания Microsoft сообщила (http://blogs.microsoft.com/next/2016/01/25/microsoft-release... о публикации на GitHub открытии исходных текстов тулкита CNTK (https://github.com/Microsoft/CNTK) (Computational Network Toolkit) с реализацией алгоритмов глубокого машинного обучения (https://ru.wikipedia.org/wiki/%D0%93%D0%.... На практике тулкит используется в сервисах, обеспечивающих распознавание произвольной речи, таких как Windows Cortana, Skype Translator и Project Oxford Speech API. Тулкит также можно использоваться для решения задач автоматизированного перевода, распознавания изображений и разбора вопросов на естественном языке. Код написан на языке С++ и распространяется (https://github.com/Microsoft/CNTK) под лицензией MIT.
CNTK позволяет создавать распределённые нейронные сети, оформленные в виде ориентированного графа (https://ru.wikipedia.org/wiki/%D0%9E%D1%... вершины в котором представляют входные значения или параметры нейронной сети, а промежуточные узлы отождествлены с матричными операциями с этими параметрами. CNTK поддерживает различные модели нейронных сетей, включая DNN c прямой связью (feed-forward), свёрточные (https://ru.wikipedia.org/wiki/%D0%A1%D0%... (CNN) и рекуррентные (https://ru.wikipedia.org/wiki/%D0%A0%D0%... нейронные сети (RNN/LSTM), а также их комбинации. CNTK ориентирован на использование GPU для вычислений и обеспечивает близкую к линейной масштабируемость при увеличении числа GPU. Поддерживается автоматическое разделение и параллелизация вычислений с привлечением кластерных конфигураций, включающих большое число GPU.
По заявлению Microsoft, CNTK заметно опережает другие аналогичные тулкиты по производительности обработки данных. Например, при развёртывании четырёхуровневой тестовой нейронной сети (https://github.com/Alexey-Kamenev/Benchmarks) на сервере с 4 GPU, CNTK быстрее Google TensorFlow (https://www.opennet.dev/opennews/art.shtml?num=43285) в 4 раза, а Torch (http://torch.ch/) и Caffe (http://caffe.berkeleyvision.org/) почти в два раза. При подключении второго узла с ещё 4 GPU производительность CNTK увеличивается на 75%. На системах с одним GPU CNTK немного отстаёт от Torch и Caffe.<center><a href="https://raw.githubusercontent.com/Microsoft/CNTK/master/Docu... src="https://www.opennet.dev/opennews/pics_base/0_1453748062.png&q... style="border-style: solid; border-color: #e9ead6; border-width: 15px;max-width:100%;" title="" border=0></a></center>
URL: http://blogs.microsoft.com/next/2016/01/25/microsoft-release.../
Новость: http://www.opennet.dev/opennews/art.shtml?num=43756
В качестве базы используется набор поведения пользователей при выходе очередного Windows Update
> По заявлению Microsoft, CNTK заметно опережает другие аналогичные тулкиты по производительности обработки данныхДануты? А правду сказать, хотя о чём это я, от этой конторы правды не дождаться /
Сдаётя мне, секрет их теста в Azure GPU Lab, возможно в CNTK используются какие-то фичи этой платформы, которые не поддерживаются у других. Не исключено, что на bare metal железе результаты будут другими.
такие проекты майкрософта надо выкладывать на депозит
Такие проэкты под Апаче надо выкладывать, а то патентами яйца прищемят.
Кто о чём, а вантузятнег - о варезе.
> На практике тулкит используется в сервисах, обеспечивающих распознавание произвольной речи, таких как Windows Cortana...Кстати, наигрался я с этой штукой. Тормозит и нормально с первого раза распознаёт только "tell me a joke".
>> На практике тулкит используется в сервисах, обеспечивающих распознавание произвольной речи, таких как Windows Cortana...
> Кстати, наигрался я с этой штукой. Тормозит и нормально с первого раза
> распознаёт только "tell me a joke".Your mum's lagging.
mom
> momBack to septic states with you.
dolbit normal'no?
> dolbit normal'no?долбит сурраунд
Лицензия MIT, следовательно, проект ещё поживёт. Дело гну/столлмана живёт и побеждает.
MIT не copyleft.
Но проекты под этой лицензией живут, в отличие от опяче и псд. Не копилефт, но штольман всё равно б-г.
Поигрался с project oxford - OCR русского текста работает шикарно, круче тессеракта на порядок. Остальное мусор :(
Это ты ещё продукцию abby не видел наверно - текст то распознать не проблема, а вот таблицы...
Проверка исходников CNTK с помощью статического анализатора: http://www.viva64.com/ru/b/0372/