Изучение технологии нейронных сетей в профильном курсе информатики

Министерство образования Российской Федерации

Биробиджанский государственный педагогический институт

Курсовая работа
по методике преподавания информатики

Изучение технологии нейронных сетей
в профильном курсе информатики

Выполнил
студент 4 курса
факультета Математики и Информатики
отделения Информатики и Экономики
Мурье Данил Александрович

Руководитель
к.п.н., доцент кафедры информатики и
вычислительной техники
Баженов Руслан Иванович

Биробиджан, 2003


Содержание

Введение……………………………………..……………………………….…………

Глава 1. Теоретические основы для разработки содержания обучения технологии нейронных сетей……………….………………………………………………………

1.1 Содержание теории нейронных сетей в профильном курсе информатики…….

1.2 Влияние обучения технологии нейронных сетей на развитие мышления школьников……………………………………………………………………………..

1.3 Теоретические аспекты профильного обучения информатики……….…………

Глава 2. Содержание обучения технологии нейронных сетей……………………….

Заключение………………………………………………………………………………

Список литературы……………………………………………………………………..


Введение

Вычислительная нейронаука (Computational Neuroscience) в современный момент переживает период перехода от юного состояния к зрелости. Сегодняшний уровень теоретического понимания и практического использования нейронных сетей в мировой информационной индустрии все явственнее требует профессиональных знаний в этой области.

Потребность в специалистах в области нейронных сетей обусловила тот факт, что разнообразные курсы по нейронным сетям начали повсеместно входить в программы высшей школы для различных технических специальностей.

Но этого недостаточно. Необходимо организовывать изучение данной области знания еще в школе. Но в школе обучение должно носить скорее характер ознакомительный и мотивирующий на дальнейшее профессиональное обучение в данной области. Целесообразнее организовывать изучение учениками технологиям нейронным сетям в профильном курсе информатики либо в рамках факультативных занятий.

Учитывая тот факт, что в России почти нет опыта по организации и проведению подобных уроков, данное исследование, будет полезным для учителей, стремящихся овладеть методикой обучения школьников нейросетевым технологиям.

Объектом исследования является процесс изучения информатики в профильном курсе.

Предмет – изучение технологии нейронных сетей в профильном курсе информатики.

Цель: разработать содержание изучения технологии нейронных сетей в профильном курсе информатики.

Для реализации цели курсовой работы необходимо выполнить следующие задачи:

1) отобрать содержание обучения нейронных сетей применительно к профильному курсу;

2) определить влияние обучения технологии нейронных сетей на развитие мышления школьников;

3) определить вид профиля и тип учебного предмета для изучения технологии нейронных сетей в школе;

4) разработать содержание изучения темы «Нейронные сети»;

5) разработать тематическое планирование.

Гипотеза: если обучить ученика технологии нейронных сетей, то ученик осознает эффективность применения рациональной стратегии мышления и будет применять эту стратегию в дальнейшем при решении различных задач.


Глава 1 Теоретические основы для разработки содержания обучения технологии нейронных сетей
1.1 Содержание теории нейронных сетей в профильном курсе информатики

Искусственный нейрон

Искуственный нейрон имитирует в первом приближении свойства биологического нейрона. На вход искусственного нейрона поступает некоторое множество сигналов, каждый из которых является выходом другого нейрона. Каждый вход умножается на соответствующий вес, аналогичный синоптической силе, и все произведения суммируются, определяя уровень активации нейрона. На рис.1

рис.1.Искусственный нейрон

представлена модель, реализующая эту идею. Хотя сетевые парадигмы весьма разнообразны, в основе почти всех их лежит эта конфигурация. Здесь множество входных сигналов, обозначенных x1, x2, x3...xn, поступает на искусственный нейрон. Эти входные сигналы, в совокупности обозначаемые вектором X, соответствуют сигналам, приходящим в синапсы биологического нейрона. Каждый сигнал умножается на соответствующий вес w1, w2, w3...wn, и поступает на суммирующий блок, обозначенный СУМ. Каждый вес соответствует "силе" одной биологической синоптической связи. (Множество весов в совокупности обозначается вектором W). Суммирующий блок, соответствующий телу биологического элемента, складывает взвешенные входы алгебраически, создавая выход, который мы будем называть NET. В векторных обозначениях это может быть компактно записано следующим образом.

NET=XW

Активационные функции

Сигнал NET далее, как правило, преобразуется активационной функцией F и дает выходной нейронный сигнал OUT . Активационная функция может быть обычной линейной функцией:

OUT=K(NET)

где К –постоянная, пороговой функцией

OUT=1 ,если NET>T

OUT=0 в остальных случаях,

где T – некоторая постоянная пороговая величина, или же функцией более точно моделирующей нелинейную передаточную характеристику биологического нейрона и представляющей нейронной сети большие возможности. На рис2

рис.2.Искусственный нейрон с активационной функцией

блок, обозначенный F, принимает сигнал NET и выдает сигнал OUT. Если блок F сужает диапазон изменения величины NET так, что при любых значениях NET значения OUT принадлежат некоторому конечному интервалу, то F называется сжимающей функцией. В качестве сжимающей функции часто используется логистическая или сигмоидальная (S-образная) функция, показанная на рис.3. Эта функция математически выражется как F(x)=1/(1+e-x) . Таким образом,

OUT=1/(1+e-NET)

По аналогии с электронными системами активационную

рис.3.Сигмоидальная логистическая функция

функцию можно считать нелинейной усилительной характеристикой искусственного нейрона. Коэффициент усиления вычисляется как отношение приращения величины OUT к вызвавшему его небольшому приращению величины NET. Он выражается наклоном кривой при определенном уровне возбуждения и изменяется от малых значений при больших отрицательных возбуждениях (кривая почти горизонтальна) до максимального значения при нулевом возбуждении и снова уменьшается, когда возбуждение становится большим положительным. Гроссберг (1973) обнаружил, что подобная нелинейная характеристика решает поставленную им дилемму шумового насыщения. Каким образом одна и та же сеть может обрабатывать как слабые, так и сильные сигналы? Слабые сигналы нуждаются в большом сетевом усилении, чтобы дать пригодный к использованию выходной сигнал. Однако усилительные каскады с большими коэффициентами усиления могут привести к насыщению выхода шумами усилителей (случайными флуктуациями), которые присутствуют в любой физически реализованной сети. Сильные входные сигналы в свою очередь также будут приводить к насыщению усилительных каскадов, исключая возможность полезного использования выхода. Центральная область логистической функции, имеющая большой коэффициент усиления, решает проблему обработки слабых сигналов, в то время как в области с падающим усилением на положительном и отрицательном концах подходят для больших возбуждений. Таким образом, нейрон функционирует с большим усилением в широком диапазоне уровня входного сигнала.

Рассмотренная простая модель искусственного нейрона игнорирует многие свойства своего биологического двойника. Например, она не принимает во внимание задержки во времени, которые воздействуют на динамику системы. Входные сигналы сразу же порождают выходной сигнал. И что более важно, она не учитывает воздействий функции частотной модуляции или синхронизирующей функции биологического нейрона, которые ряд исследователей считают решающими. Несмотря на эти ограничения, сети, построенные из этих нейронов, обнаруживают свойства, сильно напоминающие биологическую систему. Только время и исследования смогут ответить на вопрос, являются ли подобные совпадения случайными или следствием того, что в модели верно схвачены важнейшие черты биологического нейрона.

Однослойные искусственные нейронные сети

Хотя один нейрон и способен выполнять простейшие процедуры распознавания, сила нейронных вычислений проистекает от соединений нейронов в сетях. Простейшая сеть состоит из группы нейронов, образующих слой, как показано в правой части рис.4.

рис.4.Однослойная нейронная сеть

Отметим, что вершины круги слева служат лишь для распределения входных сигналов. Они не выполняют каких-либо вычислений, и по этой причине они обозначены кругами чтобы отличать их от вычисляющих нейронов обозначенных квадратами Каждый элемент из множества входов X отдельным весом соединен с каждым искусственным нейроном. А каждый нейрон выдает взвешенную сумму входов в сеть. В искусственных и биологических сетях многие соединения могут отсутствовать, все соединения показаны в целях общности. Могут иметь место также соединения между выходами и входами элементов в слое.

Удобно считать веса элементами матрицы W. Матрица имеет m строк n столбцов, где m-число входов, а n-число нейронов. Например, w3,2 -это вес, связывающий третий вход со вторым нейроном, таким образом вычисление выходного выходного вектора N, компонентами которого являются выходы OUT нейронов, сводится к матричному умножению N=XW, где N и X -векторы строки.

Многослойные искусственные нейронные сети

Более крупные и сложные нейронные сети обладают, как правило, и большими вычислительными способностями. Хотя созданы сети всех конфигураций, какие только можно себе представить, послойная организация нейронов копирует слоистые структуры определенных отделов головного мозга. Оказалось, что такие многослойные сети обладают большими возможностями, чем однослойные и в последние годы были разработаны алгоритмы для их обучения. Многослойные сети могут образовываться каскадами слоев. Выход одного слоя является входом для последующего слоя. Подобная сеть показана на рис.5 и снова изображена со всеми соединениями.

Нелинейная активационная функция

Многослойные сети могут привести к увеличению вычислительной мощности по сравнению с однослойной лишь в том случае, если активационная функция между слоями будет нелинейной.

Рис.5.Двуслойная нейронная сеть
Актуально: