The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Google опубликовал Magika 1.0, инструментарий для определения типа содержимого файлов "
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Google опубликовал Magika 1.0, инструментарий для определения типа содержимого файлов "  +/
Сообщение от opennews (??), 07-Ноя-25, 14:28 
Компания Google представила релиз инструментария Magika 1.0, предназначенного для определения типа содержимого на основе анализа имеющихся в файле данных. Magika может точно определять в содержимом используемые языки программирования, методы сжатия, установочные пакеты, исполняемый код, виды разметки, форматы звука, видео, документов и изображений. Связанный с проектом инструментарий и готовая модель машинного обучения распространяются под лицензией Apache 2.0. Обвязки подготовлены для языков Rust, Python, JavaScript/TypeScript и Go...

Подробнее: https://www.opennet.dev/opennews/art.shtml?num=64201

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


1. "Google опубликовал Magika 1.0, инструментарий для определени..."  +1 +/
Сообщение от Аноним (1), 07-Ноя-25, 14:28 
Уже чувствую, что функционала меньше, чем в libmagic (или что там утилита file юзает), а жор будет где-то метров 200 минимум.

> Обвязки подготовлены для языков Rust, Python, JavaScript/TypeScript и Go.

Хорошо, что сишные программы такой мусор юзать не будут.

Ответить | Правка | Наверх | Cообщить модератору

13. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от НяшМяш (ok), 07-Ноя-25, 15:07 
Интересно, что гугл на это даже ответить попытался: https://securityresearch.google/magika/additional-resources/...
Ответить | Правка | Наверх | Cообщить модератору

16. "Google опубликовал Magika 1.0, инструментарий для определени..."  +1 +/
Сообщение от Bob (??), 07-Ноя-25, 15:11 
Максимально оптимизируют, ибо всетмощности надо под ИИ освобождать. Ту же Гемини и чё там ещё понавыпускали.

Анализирця и обучаясь на файлах со своего диска и прочих сервисах.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

23. "Google опубликовал Magika 1.0, инструментарий для определени..."  –2 +/
Сообщение от Аноним (23), 07-Ноя-25, 15:59 
File такая кривая дрянь что это уже не смешно. Даже распознавание zip файлов регулярно ломают. Если хотя бы будет работать, то 200 мегабайт не жалко.
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

24. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (24), 07-Ноя-25, 16:09 
> отличается применением методов машинного обучения

Ого, т.е. будут галлюцинации и ложные результаты.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

42. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (42), 07-Ноя-25, 19:23 
> Уже чувствую, что функционала меньше, чем в libmagic (или что там утилита file юзает), а жор будет где-то метров 200 минимум.

На основании чего такие "чувства"? Увидели фразу "машинное обучение" - и дальше все как в тумане?

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

44. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (44), 07-Ноя-25, 19:34 
> Уже чувствую
> мусор

Окрестили софт мусором на основе своих "чуств"? Ну, это качественная опеннетная экспертиза.

> Хорошо, что сишные программы такой мусор юзать не будут.

А что за сишные программы?

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

46. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (46), 07-Ноя-25, 19:46 
> А что за сишные программы?

Которые CVE производят.

Ответить | Правка | Наверх | Cообщить модератору

49. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (42), 07-Ноя-25, 19:56 
>> А что за сишные программы?
> Которые CVE производят.

А, понятно. Ну, главное, что они "Растовый мусор" не используют. С CVE-то мы всегда жили, а вот с Растом - погибель...

Ответить | Правка | Наверх | Cообщить модератору

5. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Хлебан (?), 07-Ноя-25, 14:34 
А вот интересно, что произойдет, если этот определитель типа начнет бредить (или как еще аккуратно говорят, галлюцинировать)? Какой простор для творчества вирусописателей.
Ответить | Правка | Наверх | Cообщить модератору

7. "Google опубликовал Magika 1.0, инструментарий для определени..."  +3 +/
Сообщение от Жор (?), 07-Ноя-25, 14:45 
Там нет генеративной модели. Оно не может "бредить", может просто ошибиться при классификации.
Ответить | Правка | Наверх | Cообщить модератору

25. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (24), 07-Ноя-25, 16:11 
> может просто ошибиться

Супер! Ошибётся, запустит гифку и сломает систему.

Ответить | Правка | Наверх | Cообщить модератору

29. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от 12yoexpert (ok), 07-Ноя-25, 16:57 
так это совсем другое дело
Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору

51. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (42), 07-Ноя-25, 20:00 
> Там нет генеративной модели. Оно не может "бредить", может просто ошибиться при классификации

Нейронке не обязательно быть генеративной, чтобы галлюцинировать. "Галлюцинирование" в контексте нейронок - это когда мизерные различия входных данных приводят к разным результатам.

Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору

10. "Google опубликовал Magika 1.0, инструментарий для определени..."  –4 +/
Сообщение от Аноним (10), 07-Ноя-25, 14:49 
> А вот интересно, что произойдет, если этот определитель типа начнет бредить

Забавно, как люди одним вопросом показывают свою полнейшую некомпетентность в вопросе.

Такая нейронка не может галючинировать. Вы можете попробовать подобрать содержимое файла так, чтобы она ошиблась. И... на этом все. Точно также вы можете подредактировать файл чтобы ввести в заблуждение другие инструменты автоматического детекта типа.

Ответить | Правка | К родителю #5 | Наверх | Cообщить модератору

19. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (19), 07-Ноя-25, 15:29 
> вы можете подредактировать файл чтобы ввести в заблуждение другие инструменты

И как вы это себе представляете? Я убираю из файла заголовок/магическое число и он превращается... в бессмысленный набор байтов? Как вы собираетесь "вводить в заблуждение" инструменты, если они определяют тип файла тем же способом что и программы которые собственно работают с этими файлами — по их структуре?

Ответить | Правка | Наверх | Cообщить модератору

37. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (37), 07-Ноя-25, 18:13 
Например, есть такой контейнерный формат ISOBMFF, который используется в MP4, JPEG2000, MJPEG, FMP4. В теории можно использовать атомы одного типа в файле другого, чтобы заставить подобные штуки ошибиться.
Ответить | Правка | Наверх | Cообщить модератору

36. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от devl547 (ok), 07-Ноя-25, 18:01 
>вирусописателей

Квайн-вирусы?

Ответить | Правка | К родителю #5 | Наверх | Cообщить модератору

6. "Google опубликовал Magika 1.0, инструментарий для определени..."  +1 +/
Сообщение от Кошкажена (?), 07-Ноя-25, 14:37 
> Magika is used at scale to help improve Google users' safety by routing Gmail, Drive, and Safe Browsing files to the proper security and content policy scanners
> improve Google users' safety

Верим?

Ответить | Правка | Наверх | Cообщить модератору

9. "Google опубликовал Magika 1.0, инструментарий для определени..."  +4 +/
Сообщение от ryoken (ok), 07-Ноя-25, 14:45 
Гуглу-то..?
Ответить | Правка | Наверх | Cообщить модератору

18. "Google опубликовал Magika 1.0, инструментарий для определени..."  +2 +/
Сообщение от Bob (??), 07-Ноя-25, 15:20 
Это пресс релиз - для колхозников (юзеров гугла). Дачники (думающее) - идут мимо)

Копирайт по медиа, кряки с кейгенами по софту, дообучение своего ИИ на файлах юзеров.

Зачем вести базу "небезопасных" сайтов, если их можно сразу репортить хостеру и говорить: сноси или с выдачи уберём уже тебя)

С файлами - не всё так просто. Есть 100% вирусы, общеизвестные. А есть параноидальная шиза на любой ехе, bat, sh и т.п. файл. Ибо юзер не планктон и посмел что-то накодить или такое качнуть.

Доходит до идиотизма, когда самопальный ps или bash скрипт гугл диск как "опасный" определяет, а он пингует инет по ipv4 / ipv6 и меняет dns на гугловский)

Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору

11. "Google опубликовал Magika 1.0, инструментарий для определени..."  –6 +/
Сообщение от Анонимусс (?), 07-Ноя-25, 14:53 
> Изначально проект развивался на языке Python
> был переписан на языке Rust

Идеальная связка - прототипируем и отлаживаем на интерпритируемом языке. Реализацию пишем на современном безопасном компилируемом языке.

> обеспечивает сканирование нескольких миллионов файлов в секунду
> и нескольких сотен миллиардов файлов в неделю.

Хехе, теперь каждый раз, когда растохейтер будет открывать файлик в гуглдоксе, он будет знать, что файлик был отпроцессен софтиной на расте :)

Ответить | Правка | Наверх | Cообщить модератору

12. Скрыто модератором  +/
Сообщение от Аноним (12), 07-Ноя-25, 15:05 
Ответить | Правка | Наверх | Cообщить модератору

14. Скрыто модератором  –1 +/
Сообщение от Аноним (-), 07-Ноя-25, 15:08 
Ответить | Правка | Наверх | Cообщить модератору

15. "Google опубликовал Magika 1.0, инструментарий для определени..."  –2 +/
Сообщение от Анонимусс (?), 07-Ноя-25, 15:08 
> что-то ты рано начал накиды^W разжигать, причем начал первый

Накинули еще в первом сообщении
"Хорошо, что сишные программы такой мусор юзать не будут."


Ответить | Правка | К родителю #12 | Наверх | Cообщить модератору

22. Скрыто модератором  +1 +/
Сообщение от хрустишкапереписишка (?), 07-Ноя-25, 15:36 
Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору

17. "Google опубликовал Magika 1.0, инструментарий для определени..."  +1 +/
Сообщение от Аноним10084 и 1008465039 (?), 07-Ноя-25, 15:16 
Утилита file больше не нужна, получается?
Ответить | Правка | Наверх | Cообщить модератору

39. "Google опубликовал Magika 1.0, инструментарий для определени..."  –1 +/
Сообщение от Аноним (39), 07-Ноя-25, 18:34 
Зато нужна GTX100500 LLM и проц помощнее.
Ну и скажут тебе примерно тоже самое - "это файл, но это не точно" )
Ответить | Правка | Наверх | Cообщить модератору

41. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (42), 07-Ноя-25, 19:22 
> Зато нужна GTX100500 LLM и проц помощнее.

Тем временем в новости:

"После загрузки модели время формирования вывода составляет 5 мс при тестировании на одном ядре CPU"

Ответить | Правка | Наверх | Cообщить модератору

53. Скрыто модератором  +1 +/
Сообщение от Аноним (-), 07-Ноя-25, 20:08 
Ответить | Правка | Наверх | Cообщить модератору

20. Скрыто модератором  +/
Сообщение от Аноним (20), 07-Ноя-25, 15:29 
Ответить | Правка | Наверх | Cообщить модератору

21. "Google опубликовал Magika 1.0, инструментарий для определени..."  +1 +/
Сообщение от Аноним (21), 07-Ноя-25, 15:32 
Теперь же в процессоры добавляют эти как его за ногу NPU нейромодули, почему бы из них хоть каплю пользы не выдоить для сабжа и подобных задач?
Ответить | Правка | Наверх | Cообщить модератору

26. "Google опубликовал Magika 1.0, инструментарий для определени..."  +2 +/
Сообщение от Аноним (26), 07-Ноя-25, 16:16 
Абсолютно не нужный мусор существующий только из-за искусственного поддержания пузыря в IT. Подобный софт давно существовал и без всякого псевдо-"ИИ".
Ответить | Правка | Наверх | Cообщить модератору

27. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (27), 07-Ноя-25, 16:30 
Напоминаю, что magicka работает через откусывание от файла блока из начала, конца и середины. То есть засунув в начало, конец и середину нужные данные эту либу элементарно обмануть, при этом это нейронка, то есть не строгий алгоритмический парсинг, какой используется в реализациях, а штука, которой можно подсунуть adversarial куски, но при этом строгим парсером они всё равно будут парситься как надо. По-настоящему любой формат детектится только через попытку парсинга. На практике надо тип файла детектить по расширению, если контейнер - то парсить контейнер тоже, если тип запрещён - то ффтопку, если выглядит не запрещённым - то парсить безопасным парсером. Если не парсится - то ффтопку, если парсится - значит тот тип, что написан в расширении (даже если это химера). Либа имела бы существенную ценность для реверсинга, если бы была трансформером на индивидуальных битах и выдавала бы не тип файла, а тип данных (тип компрессии или кодировки, тип инта или тип флоата), а так это просто кусок хайпожорного дерьма, который на практике бесполезен.
Ответить | Правка | Наверх | Cообщить модератору

45. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (42), 07-Ноя-25, 19:37 
> То есть засунув в начало, конец и середину нужные данные эту либу элементарно обмануть

Так можно обмануть любой алгоритм определения типа файла. Хз, что ты хотел этим сказать.

Ответить | Правка | Наверх | Cообщить модератору

28. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (28), 07-Ноя-25, 16:53 
Зашли с коллегой на их сайт в раздел DEMO
Файл a.sh (UTF-8) с содержимым что-то типа "sudo <cmd> <cmd params>".
Строк 4-5, ничего специфического.
Определило как "Batch" (виндовый .bat) и выдало score = 87%

Как-то несолидно

Ответить | Правка | Наверх | Cообщить модератору

30. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Мемоним (?), 07-Ноя-25, 17:00 
> Sudo for Windows is a new way for users to run elevated commands (as an administrator) directly from an unelevated console session on Windows.

А в Powershell давно есть алиасы для всяких cp/mv/rm. Так что не все так просто.

Ответить | Правка | Наверх | Cообщить модератору

32. "Google опубликовал Magika 1.0, инструментарий для определени..."  +1 +/
Сообщение от Аноним (39), 07-Ноя-25, 17:05 
> Magika может точно определять

Сказал - сделай )

Ответить | Правка | Наверх | Cообщить модератору

33. "Google опубликовал Magika 1.0, инструментарий для определени..."  +3 +/
Сообщение от Аноним (33), 07-Ноя-25, 17:17 
Поочередно кинул три файла Гимпа в формате xcf с какими-то своими каляками.
1) wav 19%, tiff 9%, psd 9%, vba 5%, hlp 5%
2) tar 21%, pebin 9%, mp3 6%, psd 6%, tiff 5%
3) wav 24%, hlp 16%, tiff 13%, jpeg 3%, psd 3%
Ответить | Правка | К родителю #28 | Наверх | Cообщить модератору

54. "Google опубликовал Magika 1.0, инструментарий для определени..."  +1 +/
Сообщение от Аноним (-), 07-Ноя-25, 20:12 
> Поочередно кинул три файла Гимпа в формате xcf

Так это и не удивительно.
Они скорее всего и не обучали сетку на каком-то маргинальном формате, который используется только в одной васяно-софтине.
Попробуйте на чем-то нормальном, напр. на файлах photoshop :)

Ответить | Правка | Наверх | Cообщить модератору

31. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (39), 07-Ноя-25, 17:04 
> Magika может точно определять

Спорим ? )

Ответить | Правка | Наверх | Cообщить модератору

35. Скрыто модератором  +/
Сообщение от Аноним (35), 07-Ноя-25, 17:34 
Ответить | Правка | Наверх | Cообщить модератору

40. Скрыто модератором  +/
Сообщение от Аноним (39), 07-Ноя-25, 18:40 
Ответить | Правка | К родителю #31 | Наверх | Cообщить модератору

34. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (35), 07-Ноя-25, 17:33 
А что если определяя что файл это картинка она заодно отправит на аналог вирустотала для проверки на мыслепреступление?
Ответить | Правка | Наверх | Cообщить модератору

38. Скрыто модератором  +/
Сообщение от Аноним (38), 07-Ноя-25, 18:14 
Ответить | Правка | Наверх | Cообщить модератору

43. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (43), 07-Ноя-25, 19:33 
Жду, когда выпустят новую программу dir, которая отображает список файлов и директорий. Естественно нужно ,чтобы эта программа была обязательно на искусственном интеллекте и обучалась на типичных домашних каталогах пользователей.
Ответить | Правка | Наверх | Cообщить модератору

48. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от аролп5 (?), 07-Ноя-25, 19:52 
Это будет клиент, который будет в Майкрософт отправлять ваши файлы, анализировать и сообщать клиенту, директория это или файл )))
Ответить | Правка | Наверх | Cообщить модератору

47. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от аролп5 (?), 07-Ноя-25, 19:51 
"The client and the bindings are already open source, and more is coming soon!" Не понял, этой штуке что ли стабильный канал интернета нужен будет для работы?!
Ответить | Правка | Наверх | Cообщить модератору

50. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от ProfessorNavigator (ok), 07-Ноя-25, 19:58 
> Задействование методов глубокого машинного обучения

А что, бывают ещё методы "мелкого" машинного обучения?))

Ответить | Правка | Наверх | Cообщить модератору

55. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от Аноним (-), 07-Ноя-25, 20:17 
> А что, бывают ещё методы "мелкого" машинного обучения?))

Ну если сделаете "сетку" с малых количеством слоев, то будет не глубокое.

Ответить | Правка | Наверх | Cообщить модератору

56. "Google опубликовал Magika 1.0, инструментарий для определени..."  +/
Сообщение от ProfessorNavigator (ok), 07-Ноя-25, 20:33 
>> А что, бывают ещё методы "мелкого" машинного обучения?))
> Ну если сделаете "сетку" с малых количеством слоев, то будет не глубокое.

А с какой величины заканчивается мелкое и начинается глубокое?))


Ответить | Правка | Наверх | Cообщить модератору

52. "Google опубликовал Magika 1.0, инструментарий для определени..."  –1 +/
Сообщение от Аноним (52), 07-Ноя-25, 20:06 
"В Google система (magika) используется для классификации файлов в сервисах Gmail, Drive ..."

Подсматривать нехорошо

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2025 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру