Методы машинного обучения для выявления первопричин на пути к бездефектному производству

Выявление причин дефектов играет ключевую роль в интеллектуальном производстве наступившей эры Индустрии 4.0, поскольку оно может снизить производственные риски, свести к минимуму последствия непредвиденных простоев и оптимизировать производственный процесс. В этом материале постараемся рассказать о последних достижениях в анализе первопричин (RCA - Root Cause Analysis) для организации «производства без брака» (ZDM - Zero-Defect Manufacturing). Сейчас широко демонстрируется использование методологий машинного обучения для анализа первопричин появления «слабых звеньев» в производственной сфере. Популярность этих технологий затем обобщается и представляется в виде визуализированных графиков. Это позволяет выявить наиболее популярные и известные методы, используемые в современной промышленности. Хотя искусственный интеллект приобретает все большую популярность в интеллектуальном производстве, методы машинного обучения для анализа первопричин появления дефектности кажутся недостаточно изученными.

Мотивация и масштабность

С началом внедрения концепции Индустрии 4.0 производственные компании нуждаются в постоянной модернизации своих производственных процессов с точки зрения появления новых роботизированных систем и автоматизации операций, чтобы стать более конкурентоспособными. В их стремлении обеспечить оптимизированные производственные процессы и устойчивое производство более качественных изделий на выходе, обнаружение брака и выявление причин дефектов на начальном этапе становится решающим фактором для отрасли. В частности, обнаружение причин появления брака/дефектов используется отраслевыми операторами для проведения проверки качества на производственной линии, а идентификация источника дефекта используется для дальнейшего интеллектуального контроля качества, посредством выявления неполадок в инжиниринговом проектировании или аномалий первопричин возникновения появления дефектов.

Улучшение качества продукции является краеугольным камнем Индустрии 4.0. Технологические достижения современной промышленности поставили новые задачи на этапе повышения качества, с которыми не могут справиться традиционные методологии контроля. Появились новые концепции, такие как разработка политики производства без брака (ZDM), которые поддерживают переход к этой новой эре. Эта концепция в значительной степени опирается на новые технологии, такие как виртуальная метрология, т. е. возможность проверять качество продукции на основе производственных данных без физического измерения. Выявление причин появления брака на производстве можно дополнительно повысить за счёт интеграции многочисленных методов искусственного интеллекта (ИИ) в традиционные технологии, такие как метрология, цифровые двойники, интернет вещей, компьютерное зрение, дополненная реальность, контроль качества и профилактическое обслуживание.

Выявление дефектов направлено на мониторинг производственной линии и оценку качества продукции. Требования к качеству и спецификации дефектов предоставляются конечными пользователями на индивидуальном уровне. Обнаружение дефектов в основном ориентировано на следующие два направления:

1) визуальное обнаружение дефектов на изображениях (видео, фотографии, 3D-сканы, облака точек и любые другие форматы данных, которые могут быть непосредственно преобразованы в изображение);
2) обнаружение аномалий посредством анализа признаков, данных временных рядов и обнаружение неожиданных событий. В эпоху интеллектуального производства, основанного на потоковой информации, процедуры обнаружения дефектов могут выиграть от применения технологий машинного обучения и искусственного интеллекта, превратив ручные операции в полуавтоматические или даже полностью автоматические.

Индустрия 4.0 выводит обнаружение любых неполадок на новый уровень, исследуя не только дефекты, но и их причины. Традиционное обнаружение нацелено на выявление уже произошедших ошибок и случившихся сбоев. Таким образом, такой подход не предоставляет никакой информации о том, как избежать повторения или о том, как дефект связан с производственными процессами. Скрытые неполадки/дефекты/брак часто могут оставаться без внимания и распространяться на несколько этапов производства, прежде чем они будут обнаружены. Это приводит к принятию корректирующих действий на более позднем этапе, который, вероятно, не связан с фактической причиной. В рамках интеллектуального производства была реализована систематическая методология для выявления источников дефектов, называемая анализом основных причин (RCA). Эта методология ещё на стадии проектирования цифрового инжиниринга может искать возможные нестыковки среди этапов производства и определять основную причину, ответственную за поставку дефектной продукции. Грамотно созданные цифровые двойники производства могут моделировать различные ситуации, в которых, методом анализа, будут выявлены потенциальные причины возникновения брака. Цель RCA, очевидно, состоит в том, чтобы предотвратить повторение отказов, а поэтому эту методологию можно рассматривать как процесс оптимизации в интеллектуальном производстве, направленный на минимизацию брака продукции. Такой подход в данной концепции осуществляется путём решения вопроса “что вызвало сбой?”, а не “в чём заключается сбой?”. Таким образом, RCA может стать ключевым активом ZDM для промышленных приложений, включающих множество последовательных и сложных процессов.

Традиционные методологии RCA, такие как анализ Парето, диаграммы Исикавы «рыбья кость» и «пять почему», уже применяются в производстве. Однако эти методологии тесно связаны с опытом и знаниями, и поэтому им мешают предубеждения, индивидуализм (поскольку их нельзя сохранить или передать) и неэффективность по затраченному времени. Более того, основным недостатком традиционных методологий является недостаточное использование информации, содержащейся в данных автоматизации и роботизации производства. Большой объем данных, собираемых в ходе производственных процессов в индустрии 4.0, считается очень важным для инженерного анализа. Тем не менее, возникают исследовательские вопросы о том, как эти потоки разнородной информации можно использовать и каковы подходящие модели для их обработки, поскольку эти данные часто являются мультисенсорными, многомерными и сильно нелинейными. Машинное обучение на основе искусственного интеллекта доказало, что оно может эффективно обрабатывать такие типы данных, и поэтому его следует рассматривать для RCA.

Обширный обзор научных работ показал, что пока существует только два глобальных исследования, посвящённых RCA в производстве (e Oliveira et al., 2022; Solé et al., 2017), ни одно из которых не касается технологий ИИ. Первый обзор охватывает спектр методов RCA, применяемых в различных областях промышленности, таких как полупроводниковая и химическая. Согласно результатам, наиболее популярные методологии включают правила ассоциации/классификации, контрольные диаграммы, регрессионные модели и анализ основных компонентов. Вторая работа использует другой подход и классифицирует доступные методологии на основе причинно-следственной связи, где детерминистические и вероятностные методологии тщательно пересматриваются, ориентируясь в основном на приложения информационных технологий. Согласно этим результатам, байесовские сети являются одними из самых популярных моделей обучения в этой области.

Модели на основе машинного обучения для анализа первопричин появления брака в производственном процессе.

Существует широкий спектр моделей искусственного интеллекта и машинного обучения (AI/ML), которые могут быть задействованы в процессе RCA. Эти модели принадлежат либо к детерминированной, либо к вероятностной группе методологий на основе ИИ. Каждый класс выражает разные атрибуты, может иметь разные реализации и демонстрировать разные последствия для производительности. С одной стороны, детерминированные модели разрабатываются с применением методов статистического обучения, которые позволяют этим моделям автоматически идентифицировать закономерности в данных. Для этого модели необходимо обучать на больших наборах данных, чтобы выявить границы и взаимосвязи в массиве информации. Чем больше данных используется для обучения модели, тем выше точность прогноза. С другой стороны, вероятностные модели могут быть построены иерархически из всего того информационного потока, что позволяет их широко использовать для RCA. Типичными вероятностными моделями являются модели, основанные на байесовских сетях и вероятностных нечетких когнитивных картах (FCM - Fuzzy Cognitive Maps). Поскольку для построения этих моделей нет знаний предметной области, единственный способ — использовать алгоритмы обучения, использующие необработанные данные исследуемой системы. Были разработаны различные алгоритмы обучения, ориентированные либо на изучение как структур, так и параметров модели, либо только на изучение параметров в заданной структуре.

Глубокое обучение (DL - Deep Learning) — это подраздел машинного обучения, которое недавно продемонстрировало замечательную применимость в ряде различных применений, а также в интеллектуальном производстве. В Индустрии 4.0 глубокое машинное обучение нашло широкое применение для обработки и анализа больших производственных данных. В большинстве случаев сети DL можно обучать с помощью контролируемого обучения с большими наборами обучающих данных. Наиболее популярными методами DL являются следующие:

1) Глубокие нейронные сети (DNN - Deep Neural Networks). Они напоминают искусственную нейронную сеть (ANN - Artificial Neural Network) со многими скрытыми слоями. Разница заключается в тренировочном процессе. DNN использует глубокое обучение как класс алгоритмов машинного обучения со следующими основными аспектами:

а) использование каскада из нескольких уровней нелинейных процессоров для извлечения и преобразования признаков;

б) обучение под наблюдением (например, классификация), и/или неконтролируемым образом (например, анализ паттернов);

в) изучение нескольких уровней представлений, которые соответствуют разным уровням абстракции. Уровни образуют иерархию понятий. Глубокие нейронные сети имеют более трёх уровней, обученных моделировать нелинейные проблемы.

2) Свёрточные нейронные сети (CNN - Convolutional Neural Networks). Они являются одними из самых мощных методов машинного обучения, обладающих замечательными возможностями анализа и классификации изображений. Такие сети в основном используются в приложениях обработки изображений (семантическая сегментация, классификация изображений, сегментация экземпляров, обнаружение объектов и т. п .). Архитектура их нейронов основана на особенностях изображений, которые они обрабатывают (ширина, высота, глубина и т.). Типичные CNN имеют структуру, аналогичную ANN, и состоят из одного или нескольких фильтров (т. е. свёрточных слоев), за которыми следуют слои агрегации/объединения, служащих для извлечения признаков по задачам классификации. Поскольку CNN имеет характеристики, аналогичные характеристикам стандартной ANN (которая использует метод градиентного спуска и обратное распространение для задач обучения), но вторая содержит объединяющие слои вместе со слоями свёрток. Вектор, расположенный в конце сетевой архитектуры, может предоставить окончательные результаты.

3) Остаточные нейронные сети (ResNet), являющиеся расширением DNN. Они высоко ценятся в промышленных приложениях, где точность имеет жизненно важное значение для диагностики состояния оборудования. Res-Nets обычно работают лучше, чем подходы на основе CNN.

4) Рекуррентные нейронные сети (RNN - Recurrent neural networks). Это ANN, которые используют связи между единицами для формирования ориентированного графа (мульти-графа) вдоль последовательности. RNN используют свою внутреннюю память для обработки таких последовательностей, что не встречается в ANN с прямой связью. Однако RNN страдают от кратковременной памяти и от проблемы исчезающего градиента во время обратного распространения. Это решается алгоритмом долговременной кратковременной памяти (LSTM), представленным ниже.

5) Сети с долгой краткосрочной памятью (LSTM - Long Short-Term Memory networks). LSTM превосходят исходную RNN благодаря своей специфической структуре ячеек, которая позволяет алгоритму добавлять или удалять информацию из этой ячейки с помощью объектов, называемых гейтами (воротами». Эти «ворота» контролируют процесс запоминания, позволяя модели узнать, какую информацию хранить в долгой памяти, а какую отбрасывать. Состояние клетки напоминает конвейерную ленту. Он проходит прямо по всей цепочке, лишь с небольшими линейными взаимодействиями. Гейты — это способ опционального пропуска информации. Они состоят из слоя сигмовидной нейронной сети и операции точечного умножения. Нейронные сети с долгой краткосрочной памятью активно применяются для профилактического обслуживания и прогнозирования в производственных процессах.

Методы глубокого обучения позволяют:

1) автоматически учиться на предоставляемых данных;

2) обнаруживать основные закономерности;

3) и, в конечном итоге, принимать эффективные решения.

Благодаря автоматическому изучению признаков и возможностям моделирования больших объёмов, машинное обучение представляет собой передовой аналитический инструмент для интеллектуального производства в эпоху бигдата (больших данных - big data). Алгоритмы используют каскад уровней нелинейной обработки для изучения представлений данных, соответствующих разным уровням абстракции. Затем с помощью сквозной оптимизации выявляются и прогнозируются скрытые шаблоны. Таким образом, глубокое машинное обучение предлагает большой потенциал для расширения производственных приложений, управляемых поступающими от датчиков данными.

Проблемы

Несмотря на успешное использование искусственного интеллекта в цифровом инжиниринге, планировании производства, цифровых двойниках и в RCA, все ещё существуют значительные проблемы, которые необходимо решать:

1) Объяснимость.

Сфера искусственного интеллекта считается не вполне ясной для людей в отношении его поведения, особенно в процессе принятия решений. Это происходит из-за высокой сложности (неоднозначности) алгоритмов/моделей ИИ и увеличения количества источников данных, а также из-за используемых неявных методов обучения. Следовательно, полученные результаты не могут быть прямо и адекватно объяснены для человека. Это приводит к своего рода неудаче в применении моделей ИИ к ряду критических проблем, неспособности в целом настроить наилучший процесс принятия решений. В этом направлении объяснимый (и поясняющий) тип искусственного интеллекта (XAI – Explainable Artificial Intelligence ) является многообещающей областью, которая позволяет людям раскрыть ясность и аргументацию во многих системах, чтобы понять сложное поведение моделей при выполнении определённых задач и прийти к конкретному решению. Исходя из этого, включение XAI в методы RCA, несомненно, укрепило бы доверие к полученным решениям.

2) Качество обучения.

Производительность алгоритмов в методологии поиска причин возникновения дефектов на производстве сильно зависит от наличия качественных данных. Однако отсутствие адекватных, полных и актуальных данных (если быть точнее, то проверенных именно для этого производственного процесса) из подходящих источников, являются распространёнными проблемами в процессе обучения моделей искусственного интеллекта. Таким образом, инновационные методы обработки (например, увеличение и сохранение количества проверенных подтверждённых\заслуживающих доверия) данных крайне необходимы для эффективной деятельности Индустрии 4.0.

3) Стандартизация и интероперабельность.

В настоящее время существует широкий спектр промышленных приложений, которые уже получают выгоду от RCA на основе ИИ. Каждый оператор может, конечно, использовать свои собственные протоколы и практики. Однако установление стандартных правил, также совместимых интерфейсов и протоколов позволит обеспечить широкое сотрудничество и объединить совместные усилия для быстрого продвижения вперёд.

4) Конфиденциальность данных.

Прогресс в области искусственного интеллекта, а особенно в области машинного обучения, является результатом совместной работы нескольких участников, в том числе он основывается на данных из открытых источников, предлагаемых сообществом. Наборы данных с открытым исходным кодом, например, ImageNet, сыграли ключевую роль в создании методов искусственного интеллекта, поспособствовав их развитию и оптимизации. RCA на основе ИИ также может извлечь выгоду из таких наборов данных. Однако природа именно этого процесса требует наборов данных с разных стадий производства, которые потенциально могут раскрыть конфиденциальную информацию о ноу-хау, секретных разработках или промышленном поставщике. Таким образом, получение реального промышленного эталонного набора данных из некоторых источников является серьёзной проблемой.

5) Безопасность.

Промышленная среда требует безопасных транзакций. С одной стороны, соблюдение протоколов безопасности предотвратит утечку важной или конфиденциальной информации. С другой стороны, целостность данных также необходима для предотвращения повреждения и потери информации. Такие проблемы можно решать с помощью современных технологий, таких как блокчейн, но эта тема, безусловно, заслуживает отдельного исследования.

6) Новые технологии.

Развитие методов на основе инновационных технологий идёт быстрыми темпами, и каждый день появляются новые инструменты. Цифровые двойники (Digital Twin) позволяют создать цифровую копию производственной линии, которую можно использовать для настройки и оптимизации производственных параметров, не влияя на текущее производство. Они могут быть использованы для выявления различных дефектов при проектировании и эксплуатации производственной линии в различных ситуациях и при разных условиях, применительно к различным конфигурациям оборудования и промышленных роботов.

Подводя итог, можно сказать, что выявление первопричин образования в производственном процессе дефектных деталей является очень сложной задачей в обрабатывающей промышленности и требует обширных знаний от экспертов для проведения анализа. Если действовать устаревшими методами, то это требует больших затрат и имеет низкую степень гибкости трансформации процессов. В этом направлении методы на основе машинного обучения позволяют эмпирически моделировать огромное количество данных о производственных процессах в различных условиях эксплуатации, способствуя автоматизированному анализу первопричин, а также снижая затраты и не привлекая необходимые экспертные знания. В отличие от ручного процесса выявления причин появления брака на производстве, который ранее проводился также с использованием предварительно определённых основных причин в качестве обучения, алгоритмы на основе машинного обучения обладают способностью анализировать сложные данные из разных источников и типов, обеспечивая автоматизированный способ анализа. Технологии искусственного интеллекта и глубокого машинного обучения продемонстрировали замечательную эффективность при внедрении RCA в интеллектуальное производство. Широкий спектр моделей искусственного интеллекта всё чаще используется в производственных процессах, которые борются за оптимизацию производственных операций и за производство более качественной продукции. Для этого проверка качества и интеллектуальный контроль качества становятся ключевыми процессами на производственной линии для обнаружения брака и выявления причин его появления.

Имя:*
E-Mail:
Комментарий: