Формальные методы построения математических моделей.

Впервые методы планирования эксперимента были разработаны Р. Фише­ром в начале 20-х годов применительно к сельскому хозяйству. С начала 50-х годов начинается интенсивное применение планирования эксперимента в химии и химической технологии.

В СССР работы по планированию эксперимента начаты в 1960 году под руководством В. В. Налимова, и в настоящее время это — один из методов научного исследования.

Методы планирования эксперимента используются при иссле­довании различных объектов: доменных печей, листопрокатных станов, электролизных ванн, металлорежущих станков, радиоэлект­ронных устройств и др.

Выбор факторов и переменных состояния объекта исследования

 

Объект химической технологии можно представить схемой, изоб­раженной на рис. . По традиции входные управляемые переменные обозначим : x1, x2, ..., хn и согласно принятой терминологии назо­вем их факторами.; выходные—у1, у2, ..., уm . Они называются  переменными состояния, функцией отклика.

Выбор переменных состояния. Различают экономические и технологические переменные состояния. В качестве экономических используют производительность, себестоимость и другие показа­тели. Технологическими переменными служат качество продукта, выход целевого продукта, надежность получаемых изделий и др. Объект исследования может иметь несколько переменных состоя­ния, которые следует сократить до минимума. Опыт показывает, что в большинстве случаев удается огра­ничиться одной переменной состояния, и тогда вектор У превраща­ется в скаляр у.

Если переменных состояния несколько, то эксперимент прово­дится по каждой из них, а затем решается компромиссная задача.

При выборе переменной состояния необходимо учитывать сле­дующие требования:

1) переменная состояния должна иметь количественную харак­теристику, т. е. измеряться;

2) переменная состояния должна однозначно измерять эффек­тивность объекта исследования; это требование эквивалентно кор­ректной постановке задачи;

3) переменная состояния должна быть статистически эффектив­ной, т. е. обладать возможно меньшей дисперсией при проведении опытов; это позволяет хорошо различать опыты.

Правильный выбор переменной состояния объекта исследова­ния повышает шансы экспериментатора на успех.

Выбор факторов. При выборе факторов нужно выполнять сле­дующие требования:

1) фактор должен быть регулируемым, т. е. с помощью опреде­ленного регулирующего устройства фактор можно изменять от зна­чения x1 до значения x2. Например, расход вещества может быть изменен от 30 л/ч до 40 л/ч или количество вещества А в 100 г сме­си — от 10 г до 20 г (системотехники называют это операционной определенностью).

2) точность измерения и управления факторов должна быть из­вестна и достаточно высока (хотя бы на порядок выше точности из­мерения выходной переменной); очевидно, что низкая точность из­мерения факторов уменьшает возможности воспроизведения экспери­мента.

К факторам и переменным состояния одновременно также предъ­является ряд требований:

1) факторы и переменные состояния должны иметь области опре­деления, заданные технологическими или принципиальными огра­ничениями (пример технологического ограничения — максималь­ная производительность компрессора, подающего газ в реактор;

пример принципиального ограничения — температура кристаллизации жидкого продукта, образующегося в результате реакции);

области определения факторов должны быть таковы, чтобы при различных их комбинациях переменные состояния не выходили свои ограничения;

2) между факторами и переменными состояниями должно существовать однозначное соответствие; оно позволит в основном эксперименте построить математическую модель объекта исследования и решить поставленную задачу эксперимента.

 

Планирование эксперимента

Пассивный и активный эксперимент. Метод наименьших квадратов позволяет получить описание объекта по любым данным, лишь бы матрица системы нормальных уравнений была  невырожденной. Поэтому с появлением ЭВМ возникла идея — получать математические описания технологических процессов, пользуясь в качестве исходных данных результатами нормальной эксплуатации процесса.

В реальных условиях технологический процесс все время испытывает случайные колебания режима. Сегодня значения контроли­руемых факторов—несколько иные, чем вчера, а завтра будут еще немного другими. Нельзя ли каждое изменение режима рассматри­вать как эксперимент, и, обработав совокупность таких «экспери­ментов» методом наименьших квадратов, получить описание про­цесса, а затем использовать это описание для управления и опти­мизации? Такой подход получил название пассивного экспе­римента.

Достоинство пассивного эксперимента—отсутствие затрат на опыты: данные получаются «сами собой». Но надежды, возлагав­шиеся на этот метод, в большинстве случаев не оправдались.

Анализ неудач пассивного эксперимента  выявил несколь­ко их причин.

·        Во-первых, в нормальных условиях колебания режи­ма малы, опытные точки находятся близко одна к другой. Хорошо известно, что чем ближе опытные точки, тем сильнее влияют на описание случайные ошибки. Действительно, различия в получае­мых значениях отклика при этом малы, и эти малые различия пло­хо выделяются на фоне шума—случайных ошибок. Поэтому зна­чения коэффициентов регрессии оцениваются со значительными ошибками.

·        Во-вторых, в пассивном эксперименте факторы сильно коррелированны. Это делает крайне ненадежным ана­лиз влияния отдельных факторов—всегда может оказаться, что влияет не данный фактор, а другой, с ним коррелированный.

·        В-третьих, сами значения факторов в производственных усло­виях часто измеряются с заметными ошибками; поэтому применение метода наименьших квад­ратов в его обычном варианте становится некорректным.

В связи с этим в теории экспери­мента любой эксперимент, при планировании которого не учтено влияние плана эксперимента на статистические свойства получае­мых оценок, часто называют пассивным. Ему противопоставляют активный эксперимент, в основе которого лежит планирование эксперимент а.

Планы экстремального эксперимента. Химики-технологи наи­более широко пользуются планами так называемого экстремально­го эксперимента, разработанными для определения оптимальных условий протекания процессов в объектах исследования. Оптимум определяется по математической модели объекта исследования, которую ищут в виде полиномиального уравнения:

 

 

 

 

если объект характеризуется одной переменной состояния. Логи­ку появления полинома как математической модели объекта ис­следования можно  объяснить следующим образом. Исследователь полагает, что математическую модель объекта прин­ципиально можно представить дифференциальными уравнениями. В общем виде искомое решение можно пред­ставить функцией:

y= F (X,b),                            

где у—переменная состояния объекта исследования; Х—матри­ца факторов; b — матрица коэффициентов.

Коэффициенты b полинома можно интерпретировать как коэф­фициенты ряда Тейлора, в который «удается» разложить решение  в окрестностях некоторой точки .

Пользуясь статистическими методами и учитывая конечность экспериментальных данных, можно получить оценки  коэффи­циентов регрессии b- b в уравнении (1).

Уравнение (1)называют уравнением регрессии и широко используют для получения математиче­ской модели объекта исследования.

Обработка экспериментальных данных.

Прежде чем приступить к планированию эксперимента, необходимо убедиться в том, что опыты воспроизводимы, Для этой цели проводят N серий  из k параллельных опытов в рассматриваемой области изменения влияющих факторов.

            Результаты  опытов заносятся в таблицу:

Номер

серии

опытов

 

Результаты параллельных опытов

 

yj,средн.

 

sj2

1

Y11

Y12

………..

Y1k

Y1средн

s12

2

Y21

Y22

………..

Y2k

Y2средн

s22

3

Y31

Y32

………..

Y3k

Y3средн

s32

 

 

 

 

 

 

 

j

Yj1

Yj2

………..

Yjk

Yjсредн

sj2

 

 

 

 

 

 

 

N

YN1

YN2

 

YNk

YNсредн.

SN2

 

 

 

 

1)      Определяется среднее арифметическое значение функции отклика для любой серии опытов j (j=1(1)N):

 Оценивается дисперсия для каждой серии параллельных опытов:

            Определяется расчётное значение критерия Кохрена:        ;

                                          

4)  По специальным таблицам определяют  табличное  значение Кохрена - GT. Они зависят от  доверительной вероятности P(как правило P=0.95),от N и от f=k-1.

Если выполняется условие :  Gp GT , то опыты считаются воспроизводимым

Определяется  погрешность эксперимента. Оценка дисперсии воспроизводимости рассчитывается по формуле: ,с ней связано число степеней свободы N*(k-1)

 

Полный факторный эксперимент.

 

В последовательно­сти реализации планов можно выделить следующие этапы:

1) оценка априорной информации и отсеивание факторов, не­существенных для конкретного объекта исследования;

2) получение математической модели объекта в виде линейной функции отклика;

3) поиск оптимальной области объекта по линейной функции отклика;

4) получение математической модели объекта исследования об­ласти оптимума в виде нелинейной функции отклика;

5) поиск оптимальной координаты факторного пространства в области оптимума.

Экстремальный эксперимент заканчивается определением оптимальной коорди­наты, соответствующей оптимальным условиям протекания процес­сов объекта исследования.

В подавляющем большинстве процессы химической технологии являются сложными; на процесс влияет не один, а ряд факторов.

Возможны два подхода к исследованию таких многофакторных систем. Первый можно описать формулой: «Изменяй факторы по одному». Исследование системы разбивается на серии, в пределах каждой из которых изменяется (варьируется) лишь один фактор, а остальные неизменны. В следующей серии изменяется второй фак­тор и т. д. Идея другого подхода— построить план экспери­мента, предусматривающий изменение всех влияющих факторов, с тем, чтобы этот план обеспечивал максимум точности, минимум корреляции и другие хорошие статистические свойства. Такой экс­перимент называют многофакторным.

Долгое время в науке господствовал первый подход. Его глав­ное преимущество—наглядность: данные каждой серии легко поддаются интерпретации.

Один из важных результатов теории планирования эксперимен­та заключается в том, что второй подход—значительно эф­фективнее первого. При том же объеме эксперимента и той же точности опытов получается большая точность резуль­татов.

Геометрическим образом совокупности независимых перемен­ных х и зависимой переменной у является пространство n+1 изме­рения, где nчисло независимых переменных; (n+1)-е измерение относится к у. В этом пространстве зависимости у от всех х соот­ветствует  n-мерная поверхность, которую обычно называют по­верхностью отклика (результат опыта рассматривается как отклик системы на опыт—заданную совокупность независи­мых переменных, или входов).

План эксперимента указывает расположение опытных точек в n-мерном пространстве независимых переменных (факторном пространстве), или иными словами, условия всех опытов, которые следует провести. Чаще всего план эксперимента задается в виде матрицы планирования — прямоугольной таблицы, каждая строка которой отвечает условиям определенного опыта, а каждый столбец—значениям какой-то из независимых перемен­ных в разных опытах.

Полным факторным экспериментом называется система опытов, содержащая все возможные неповторяющиеся комбинации уровней варьирования факторов.

 Матрица планирования. Для удобства вычислений коэффициентов регрессии все фак­торы в ходе полного факторного эксперимента варьируют на двух уровнях: нижнем -1 и верхнем +1, соответствующих значениям кодированных переменных X1,X2,……Xn .

Таким образом, полным факторным экспериментом называется система опытов, содержащая все возможные неповторяющиеся комбинации уровней варьирования факторов.

В таблице приведены условия опытов полного трехфакторного эксперимента. Эти опыты соответствуют в факторном простран­стве вершинам куба с центром в начале координат.

 

Номер

опыта

 

Факторы

Функция

отклика

 

 

X1

X2

X3

1

-1

-1

-1

y1

2

+1

-1

-1

у2

3

-1

+1

-1

у3

4

+1

+1

-1

у4

5

-1

-1

+1

у5

6

+1

-1

+1

у6

7

-1

+1

+1

v7

8

+1

+1

+1

у8

 

Каждый фактор принимает лишь два значения — варьи­руется на двух уровнях, верхнем и нижнем. Поэтому общее число экспериментов N=2 n

Пример. В четырех опытах исследуется влияние 3 факторов :температуры T,К, давления р, МПа, и времени t, с, на выход продукта.

 Здесь в любом из опы­тов температура—либо 1000 К (нижний уровень), либо 1200 К (верхний уровень); аналогично варьируются р и t.Выбор центра плана и интервалов варьирования.:

 

 

Температура

Давление

Время

Основной уровень

1000

750

50

Интервал варьирования

100

250

10

Верхний уровень

1200

1000

60

Нижний уровень

1100

500

40

 

 

 

 

Матрицу планирования эксперимента для этого случая может иметь вид:

 

№№

T

P

t

1

1000

500

40

2

1200

500

40

3

1000

1000

40

4

1200

1000

40

5

1000

500

60

6

1200

500

60

7

1000

1000

60

8

1200

1000

60

 

 

Из таблицы видны основные принципы построения матриц планирования полного факторного эксперимента:

Матрица планирования ПФЭ обладает следующими свойствами:

где          j- номер опыта; i—номер фактора,(l¹m) Свойство, выраженное последним

 уравнением, называется ортогональностью матрицы.

Оно позволяет вычислять коэф­фициенты регрессии по простым формулам независимо друг от друга

Расширенная матрица—это матрица, дополненная столб­цами, учитывающими взаимодействия факторов. На прак­тике, как правило, ограничиваются парными взаимодейст­виями.

Расчет коэффициентов регрессии. Коэффициенты регрессии рассчитываются методом наи­меньших квадратов. Основное условие метода формулируется следующим образом: коэффициенты регрессии определяются на основании минимизации суммы квадратов отклонений между экспериментальными уэ, и рассчитанными по уравне­нию регрессии yр значениями функции отклика:

После определения коэффициентов регрессии определяем значимость этих коэффициентов. Все коэффициенты подразделяются на значимые и незначимые. Для определения значимости коэффициентов регрессии сравнивается погрешность вычисления  коэффициента с погрешностью экспериментальных  данных -  . Вычисляется доверительный интервал:     

.

Здесь tT - табличное значение критерия Стьюдента, которое находится по числу степеней свободы и доверительной вероятности. Тогда значимость оценивают, сравнивая абсолютные значения коэффициента и доверительного интервала:

.

Если это условие выполнено, то  i -  коэффициент признаётся значимым.

Незначимые коэффициенты отбрасываются из уравнения регрессии, после чего записывается окончательный вид уравнения регрессии. Это уравнение проверяется на адекватность. Для этого вычисляется  оценка дисперсии адекватности :

 

Здесь B- число значимых коэффициентов регрессии.

Вычисляют расчётное значение критерия Фишера:        

По таблице находят табличное значение критерия Фишера. Оно зависит от доверительной вероятности P, числа степеней свободы fад= N-B  и f= N*(k-1). На основании этого делается вывод об адекватности или неадекватности уравнения регрессии. Уравнение регрессии считается адекватным, если выполняется условие:  Fр FT.

Чем меньше B, тем больше  N-B—в этом одна из главных целей, достигаемых при исключении незначимых членов.

Если уравнение неадекватно, переходят к более сложной модели (например, повышают степень многочлена), для чего обычно тре­буется постановка добавочных опытов. Иногда можно обойтись без дополнительного эксперимента, если соответствующим образом преобразовать переменные у или х .

Интерпретация уравнений регрессии — важнейший этап модели­рования процессов при использовании планирования эксперимента. Интерпретация включает анализ прежде всего влияния отдельных факторов и их взаимодействий, а затем—особенностей поведения функции отклика в различных частях изученной области фактор­ного пространства.

Влияние факторов проще всего анализировать по уравнению 1-й степени. Здесь вначале оценивается знак коэффициента ре­грессии, показывающий, в какую сторону—увеличения или умень­шения — влияет на отклик данный фактор.

Планированный эксперимент позволяет также сопоставить влияние отдельных факторов. В обычных уравнениях регрессии значение одного коэффициента трудно сопоставлять со значением другого. Факторы (а соответственно, и коэффициенты регрессии) суть величины размерные, и нельзя сказать, что на­пример, больше: 1 м или 0,001 кг. В планированном эксперименте факторы приведены к безразмерному кодированному виду; в этом виде каждый из них варьируется в одинаковых пределах, от —1 до +1. Поэтому большее, чем  bq, по абсолютной величине значение  bp означает, что в заданных пределах варьирования изменение р-го фактора сильнее повлияет на отклик, чем измене­ние q-го фактора.

В том случае, когда  b1,b2 и b12 имеют одинако­вый знак , обычно говорят о синергиз-ме влияния факторов X1 и X2: каждый из них при их совместном увеличении влияет сильнее, чем если они увеличиваются порознь.

Если знаки коэффициентов  b1 и b2 одинаковы, а  b12 имеет про­тивоположный знак, то каждый фактор в отдельности влияет силь­нее, чем при одновременном воздействии второго.

Подбор состава катализатора. Изучено влияние компонентов А и В на активность катализатора. Получено уравнение регрессии, в котором  X1количество А в композиции; .X2—количест­во В (обе величины—в кодированных единицах); у—относительная активность катализатора. Оказалось, что коэффициент  b2 незначим; уравнение имеет вид:

y=58,6+ 19,8*X1 + 10,4*X1*X2.

Уравнение можно интерпретировать так. Вещество А — активный компо­нент катализатора. Добавление его в смесь резко увеличивает актив­ность. Вещество В — промотор. Само по себе, отдельно от А, оно активно­стью не обладает. Но его добавление существенно повышает общую активность.

 Пример. Испытание лекарств.   Синтезированы два лекарственных препарата против гриппа. Их влияние  изучено на подопытных животных. Факторы X1 и  X2дозы первого и второго лекарств 'при совместном их применении; при этом уровень—1 для того и дру­гого лекарства означает, что данный препарат в данном опыте не дается. От­клик — среднее число дней от начала лечения до выздоровления.  

 Уравнение регрессии имеет вид: у = 6,4 — 2,1*X1 — 1,8*X2 + 4,2*X1*X2

Ясно, что лекарства плохо совместимы, их совместное применение нецелесо­образно. Если использование первого лекарства привело к выздоровлению (в среднем) за 1,9 дня, второго—за 2,5 дня, то при одновременной даче обоих лекарств выздоровление наступило через 6,7 дня.

Если адекватно уравнение, полученное по данным факторного эксперимента на 2-х уровнях (безразлично, линейное или содержа­щее взаимодействия), то наибольшее и наименьшее в изученной области значения отклика, предсказываемые уравнением, лежат в каких-либо из точек полного факторного эксперимента. В тех случаях, когда экспериментатора интересует максимум или минимум отклика (максимум выхода или прочности, минимум загрязнений или затрат, и т. п.), соответ­ствующая точка окажется наилучшей для данной области..

Когда объект описывается уравнением 2-й степени, то чаще все­го нас интересует либо положение экстремума, либо общий харак­тер зависимости, или же уравнение регрессии нужно нам лишь как фрагмент, который будет включен в более сложную матема­тическую модель.