Тобиас Олейник: «Работай с поведением, а не наведением»
Реферат по итогам семинара с Тобиасом Олейником 6-7 апреля 2013 г.
Философия дрессировки Тобиаса Олейника заключается в следующем.
Все поведение собаки обусловлено двумя целями: улучшить свое положение и избежать неприятного. Собака (как, впрочем, и человек) по натуре эгоист. Если она что-то делает (или чего-то избегает), то только для личного блага. Умело комбинируя приятные и неприятные для собаки ситуации, мы способны ее эффективно обучать.
Главное в этом обучении – найти оптимальный баланс между мотивацией и концентрацией. Мотивация – это то, что заставляет собаку проявлять инициативу и активность. В обычной дрессировочной практике это еда или игрушка (добыча). Концентрация – это то, что заставляет собаку быть внимательной к проводнику все время. Концентрации мы научаем, в основном, через негативное обучение.
Обучение собаки только в негативе и излишняя дозировка негативного воздействия – неэффективны, т.к. вызывают у собаки стресс. Стресс – это физиологическое состояние, следствие резкого изменения гормонального баланса (выброса «гормонов стресса»), которое невозможно быстро скомпенсировать. 24-36 ч – это время нормализации гормонального баланса после стресса. Все это время работа с собакой, получившей сильный стресс, будет неэффективна.
Философия дрессировки Тобиаса Олейника
Обучение собаки в сильном драйве (трибе) также не дает хорошего результата. У драйвовой собаки при обучении на мяч глаза «застланы пеленой», как у женщины перед витриной с десятками пар модной обуви (сравнение Тобиаса). В таком состоянии усвоение каких-либо навыков очень неэффективно.
Поэтому основная методика обучения, которую использует Тобиас – это система НеПоПо, с пищевым подкреплением и очень дозированным негативным воздействием. Для всей базовой работы в послушании используется кликер и ошейник-удавка – это два главных инструмента. Строгий ошейник и ЭШО – это также инструменты обучения, которые дополняют базовый инструментарий. Кроме того, для работы с отдельными упражнениями используется коробка, стол, зеркала и устройство для выброса мячей.
НеПоПо (негатив-позитив-позитив) слагается из двух основных способов обучения: позитивного и негативного.
Суть ПОЗИТИВНОГО обучения:
Собака показывает нужное поведение – и получает желаемое (подкрепляется);
Собака не показывает нужное поведение – и НЕ получает желаемое.
Подкрепление должно следовать за требуемым поведением в пределах 2 с, только тогда будет установлена рефлекторная связь между подкреплением и поведением.
Ограничения позитивного обучения: им можно НАУЧИТЬ ЧЕМУ-ЛИБО, но не ОТУЧИТЬ от чего-либо.
Наиболее эффективной техникой позитивного обучения является кликер-дрессировка. Задача кликера – своевременно дать четкий и понятный сигнал собаке. Кликер может использоваться одним из способов:
А) в качестве сигнала прекращения (отмены) поведения (напр., освобождение из позиции «стоять»);
Б) в качестве маркера желательного поведения (напр., подтверждение правильной позиции «стоять»), при этом поведение должно продолжаться до тех пор, пока проводник не отменит его другим способом (командой на освобождение).
Приступая к кликер-дрессировке, нужно выбрать для себя один из указанных вариантов. Тобиас использует кликер как сигнал отмены поведения, а для маркирования желательного поведения, он применяет другие маркеры (голосовые маркеры «» и др.).
При обучении в позитиве необходимо учитывать огромную роль невербальной формф коммуникации с собакой. Собака воспринимает голосовые команды «во-вторых», а в первую очередь она читает сигналы тела проводника. Лучшей проверкой усвоения собакой вербальных команд является упражнение, когда проводник стоит спиной к собаке на расстоянии нескольких шагов и отдает ей, к примеру, команду принятия основного положения, не изменяя позу тела, рук и т.п. Если собака усвоила вербальную команду, она займет ОП быстро и точно. Поэтому если собака привыкла к помощи невербальными командами, то на соревнованиях лучше сделать подсказку языком тела и потерять немного баллов, чем «провалить» упражнение целиком.
Суть НЕГАТИВНОГО обучения:
Если собака не показывает желательного поведения, она получает негативное воздействие до тех пор, пока не начнет требуемое поведение преъявлять. Прекращение негативного воздействия уже является для собаки ПОЗИТИВОМ.
Негативное воздействие должно начинаться ОДНОВРЕМЕННО с сигналом на желательное поведение (напр., отдачей команды «зитц») и прекращаться в момент исполнения требуемого (напр., в момент плотного прикосновения собаки задом к земле).
Негативное воздействие должно быть ЧЕТКО ДОЗИРОВАННЫМ: ни излишне большим (что ведет к стрессу и «выключению» собаки), ни слишком маленьким (собака не будет стремиться его избежать). В качестве примера можно привести комара, летающего ночью над головой дремлющего человека: жужжание комара не болезненно, но оно столь неприятно, что человек стремится его прекратить. Конкретный уровень воздействия определяется собакой и ее трибом в данной ситуации.
При обучении собаки необходимо учитывать, что связь между сигналом и поведением (образование навыка) происходит через 80-120 повторений (превращение этой связи в привычку (т.е. самоподкрепляющее поведение, происходит примерно после 1000-1200 повторений – прим.мое). При обучении навыку эффективны короткие занятия (3-5 минут), в течение которого производится 2-3 подхода (повторения). Длительные, изнурительные занятия по 20-30 минут и более при обучении бессмысленны. Это можно сравнить с пустым стаканом на 200 мл, куда пытаются налить литр жидкости из бутылки – больше емкости самого стакана в него не войдет, остальное будет бесцельно пролито.
Негативная техника в системе НеПоПо научает собаку КОНЦЕНТРАЦИИ. Концентрация – это сосредоточенное и внимательное состояние собаки, исходная база обучения любому навыку. Ключ к начальному обучению концентрации – пищевое подкрепление. Еда делает собаку спокойной, раскрывает для обучения. Собака смотрит на еду в руке – и получает ее. Обучение происходит только на низком уровне возбуждения. Как только собака научилась концентрации на чем-то простом, задачу можно усложнить. И только когда собака уже усвоила все упражнение (элемент), можно переходить к повышению мотивации и разгону драйва.
Таким образом, последовательность обучения навыку, по-Тобиасу:
КОНЦЕНТРАЦИЯ -> ВЫРАБОТКА НАВЫКА -> ДРАЙВ
Еще одно условие эффективного обучения: у собаки должен быть резерв в ее мотивации. Нельзя сразу давать ей лучшее (наиболее желаемое). Лучшее она получает за лучшее выполнение. Для драйвовой добычной собаки мяч – только за лучшую (быструю и четкую) работу.
СЛИШКОМ МНОГО ПРИНУЖДЕНИЯ, СЛИШКОМ ВЫСОКАЯ ДОЗИРОВКА И СЛИШКОМ МНОГО СТРЕССА – ЭТО ТУПИКОВЫЙ ПУТЬ
При обучении желательному поведению нужно: много повторов, низкая дозировка негатива.
При отучении от нежелательного поведения нужно: более высокая дозировка негатива, но меньше повторов. Тобиас считает, что 8-10 эффективных воздействий достаточно, чтобы прекратить нежелательное поведение. Но в спорте главное – научать, а не отучать.
Ранее собаку обучали так: до года собака училась в позитивном методе. Если она отвлекалась, следовала подсказка и положительное подкрепление. В год собаке надевали строгач и заменяли им подсказку. Но собака ранее не была научена этому воздействию, ни толком самому навыку. Поэтому более действенно с самого начала использовать комбинацию позитивного и негативного способов обучения.
Кусочком корма можно мотивировать собаку сделать что-то желаемое проводником, но нельзя предотвратить погони за зайцем, если он встретится на пути. Обучение в позитиве исключает физический контакт с собакой: собака сама демонстрирует нужное поведение, которое затем подкрепляется. Но чтобы избавиться от нежелательного поведения, его нельзя избежать поощрением, и его нельзя убрать игнорированием.
Преимущества позитивного метода обучения – мотивация и положительные эмоции, недостаток – ненадежность. Преимущества негативного метода – надежность, стабильность поведения, недостаток – стресс при неправильно выбранной дозировке негативного воздействия, а также отсутствие драйва у собаки.
НеПоПо, таким образом, комбинирует оба этих способа:
1 фаза – негативное воздействие;
2 фаза – прекращение негативного воздействия = позитив для собаки;
3 фаза – подкрепление (позитив).
Эта техника может быть проиллюстрирована на отработке корректного ОП. Движение рядом лучше начинать формировать из уже сделанного корректного основного положения.
На первом этапе собака высаживается сбоку от проводника, в подмышку проводник кладет мешочек с кормом или игрушку, которые используются не как поощрение, а как точка концентрации (фокус). Поводок у проводника в левой руке. После отдачи команды следует легкое воздействие поводком (натяжение), которое прекращается, как только собака соберет взгляд в точке фокусировки. В этот момент воздействие прекращается, проводник радостно хвалит собаку (маркирует правильное поведение). После короткой паузы выпадает мячик или дается еда (второе поощрение). На данном этапе собака может сколь угодно долго смотреть в другую сторону, мы ждем, пока она выберет правильное поведение сама.
На втором этапе собака высаживается под небольшим углом (для начала 25-30 градусов) к проводнику, но ее правая передняя лапа должна быть на уровне ноги проводника (чтобы собака училась доворачивать заднюю часть корпуса, а не крутилась целиком). Схема работы та же, что и на предыдущем этапе: команда -> воздействие поводком –> прекращение воздействия после занятия корректной позиции и концентрации в точке фокусировки -> отмена воздействия -> поощрение. Если собака «тупит» и не понимает, что он нее требуется, на данном этапе можно ввести подсказку – небольшой поворот корпуса проводника от собаки (чтобы побудить ее начать доворачиваться к проводнику) или легкие (маркирующие) рывочки поводком за строгач.
На третьем этапе начинается движение – сперва полшага, потом шаг, два и т.д. Воздействие поводком начинается только тогда, когда собака отклоняет голову от правильного положения.
В качестве средства негативного воздействия при непосредственном контакте с собакой лучше, в основном, использовать удавку, а не парфорс. Строгач способствует возбуждению, повышению драйва, а удавка, наоборот, успокаивает (конечно, если не тянуть за нее со всей дурью). Удавка позволяет создать четкое и ровное воздействие, более понятное для собаки. Строгач можно использовать для серии коротких воздействий (рывочков) небольшой интенсивности, которые зачастую действуют как подсказка. И еще раз необходимо подчеркнуть: негативное воздействие начинается с сигнала (в момент обучения связи «сигнал-действие» – после него, в момент закрепления навыка – одновременно с ним) и заканчивается ровно в тот момент, когда собака сделала, что требуется (напр., плотно прижала зад к земле при команде «сидеть»).
БАЗОВОЕ ОБУЧЕНИЕ СОБАКИ
Базовое обучение собаки в технике НеПоПо начинается с работы на столе в обучении статическим командам «сидеть», «лежать», «стоять». Эти упражнения, с одной стороны, научают собаку концентрации, с другой, являются универсальными в плане методики всех прочих упражнений и, наконец, тренируют навыки конкретных элементов послушания. Некоторое время назад работали только над позициями «сидеть» и «лежать». Сегодня сразу начинают работать и с позицией «стоять», хотя она нужна только для IPO-3. Делается так потому, что если позже начинать работать с позицией «стоять», то другие навыки часто разрушаются. Работу проводят с кликером.
Обучение проходит через следующие этапы:
Приучение к столу. Собаке объясняют, что стол – это хорошо. Для этого ее кормят со стола. Цель – добиться спокойного, бесстрессового отношения к инструменту обучения. Когда собака спокойна, ее ставят на стол и кормят на нем с руки, с разных сторон стола. Для предотвращения падения поводок пристегивают к верхней перекладине над столом. Конечная цель данного этапа – спокойное поведение собаки на столе и внимание к руке с кормом.
Далее собаку научают принимать три статических позиции по сигналу, которым является легкое нажатие пальцем на соответствующие точки тела: лежать – на круп, сидеть – на холку, стоять – на нижнюю часть живота. Нажатие делают одновременно с наведением: когда собака сконцентрирована на руке с кормом, производится нажатие (негативное воздействие), с одновременным движением маркера, которое облегчает занятие нужного положения. Как только собака, например, легла, нажатие прекращается, далее клик – и скармливается кусочек. Постепенно увеличивают время концентрации собаки на маркере (руке с едой) и уменьшают силу воздействия. Конечная цель – добиться концентрации собаки на руке в течение 10 с, а давление в точке свести к легкому прикосновению пальцем. В некоторых случаях, если собака начинает сильно реагировать на движение рук, меняя позу, можно сигнал давать не пальцем, а кончиком стека.
Как только навык на столе сформирован, он переносится на землю. Первичная цель – воспроизведение навыка так же, как и на столе. На этом этапе удобно использовать коробку, которая ограничивает подвижность собаки и не дает ей смещаться. Основная задача этого этапа – начать удаляться от собаки, для чего сигнал нужно заменить с нажатия пальцем (мануальный контакт) в натяжение поводка. Делается это строго в соответствии с принципом формирования условного рефлекса: дается легкое натяжение поводка, потом следует нажатие на точку, после занятия собакой нужной позы и концентрации – клик и подкрепление. Обычно используют следующие направления натяжения поводка: сидеть – вверх, лежать – вниз, стоять – вперед. Как только поводок становится сигналом, мануальный контакт прекращают.
На этом этапе проводник отдаляется от собаки на 2-3 шага и работает с поводком и вводит словесную команду. Задача – обеспечить связь со словесной командой и работу на удалении от собаки. Техника аналогична этапу 3: команда – воздействие поводком – желательное поведение и концентрация – подкрепление. Как только собака начала реагировать на словесную команду (это достигнуто, когда собака начинает реагировать на команду еще до движения поводком), команду и натяжение совмещают по времени (до этого команда раньше на 0,5-1,5 с для образования рефлективной связи).
Образование связи между сигналом и поведением возникает через 80-100 повторений (если все делать правильно).
Для работы с собакой на удалении незаменим ЭШО. ЭШО и кликер – инструменты обучения, имеющие одинаковые важные свойства: супертайминг (возможность точного по времени воздействия) и супердозировку (воздействие не зависит от субъективных ощущений проводника, как например, при работе со строгачом, когда в разных ситуациях проводник может дать совершенно разную силу воздействия, которая ему кажется одинаковой). Перед применением ЭШО собака должна быть научена мануальному (механическому) воздействию, т.к. его следует вводить после этапа (2). Введение ЭШО происходит точно так же, как и введение поводка. (Т.к. воздействие ЭШО не направлено (не имеет вектора силы), то оно должно вводиться после четкого усвоения навыка на механике – прим. мое.)
При обучении упражнению «основное положение» ЭШО следует вводить только после отработки этапа с натяжением поводка, и не ранее.
ОБУЧЕНИЕ ПЛОТНОМУ УДЕРЖАНИЮ ПРЕДМЕТА ПРИ АПОРТИРОВКЕ
Наиболее частыми проблемами в апортировке являются жевание предмета (и/или неплотное удержание) и замедление собаки в нескольких метрах от проводника при подноске предмета. Эти проблемы обусловлены стрессом, который получает собака от проводника в процессе тренировок, когда за неплотное удержание, кривую посадку и т.п. проводник корректирует собаку во фронтальной позиции. Можно привести хороший пример: когда молодая собака приходит на площадку и «открывает для себя» стойку с апортами, то нередко она хватает апортировочный предмет и носится радостно с ним по площадке, не демонстрируя ни малейшего намека на жевание; и всего через пару-тройку месяцев эта же собака сидит с предметом перед проводником и жует. Причина – стресс.
Техника НеПоПо позволяет научить собаку плотному крепкому удержанию предмета и обеспечить отсутствие психологического конфликта с проводником во фронтальной позиции.
На первом этапе собаку приучают удерживать в пасти пластиковую трубку подходящего диаметра. Пластик используется для того, чтобы не создать нежелательной ассоциации с деревянной поверхностью, если что-то пойдет не так. Удобнее всего начинать работу на столе.
Собаку фиксируют ошейником, закрепленным к вертикальной боковой стойке, и перекинутым через корпус в районе задних ног поводком (поводок перекидывается через верхнюю штангу и фиксируется) так, чтобы собака не была подвешенной, но не имела возможности сесть или гулять по столу. Фиксация проводится в спокойной обстановке, при необходимости, с подкормкой, чтобы исключить возникновение стресса. Когда собака успокоилась и концентрируется на стоящего перед ее мордой проводника, проводник двумя пальцами левой руки раздвигает челюсти собаки и вкладывает ей в пасть трубку; при этом должно последовать одновременное дозированное натяжение поводка, который пристегнут к удавке под нижней челюстью собаки. Как только собака продемонстрировала намек на удержание предмета, натяжение прекращается, – клик – подкрепление. Это повторяется несколько раз, задача – объяснить собаке, что нужно взять трубку и совсем чуть-чуть ее подержать, и это приятно (т.к. когда она держит предмет, прекращается неприятное натяжение, а затем следует приятное подкрепление).
Постепенно увеличивается время, в течение которого собака должна удерживать предмет – от буквально 0,5 с до полуминуты. Если собака начинает жевать предмет, приоткрывает пасть или выплевывает трубку (проводник должен постараться ее подхватить), то незамедлительно следует дозированное, но неприятное натяжение, которое продолжается до тех пор, пока предмет плотно не будет удерживаться в пасти. Как только это усвоено, переходят к следующему этапу.
На втором этапе работа переносится на землю. Сперва отрабатывают все то же, что и на столе, с трубкой. Задача – получить нужное поведение собаки во фронтальной позиции перед проводником. Плотность удержания усиливают провокацией – попыткой выдернуть предмет из пасти влево или вправо. Если это получается, следует натяжение, которое прекращается после плотного и крепкого удержания предмета.
Далее работа ведется уже с апортировочным предметом с боковиной на магните. Техника та же. После наработки навыка крепость удержания усиливают, периодически пытаясь выдернуть предмет в сторону (убедитесь, что боковина предмета достаточно легко «отстегивается», чтобы не травмировать пасть и не сломать зубы).
В дальнейшем эта техника включается в апортировочный комплекс. Скорость апортировки нарабатывается с ЭШО, который используется как негативное воздействие до конечной точки – высадки собаки в ФП с крепко удерживаемым предметом.
Дискуссионный вопрос возникает в связи с требованием к упражнению апортировки - не упираться предметом проводника (в последней редакции FCI). Многие проводники сейчас переучивают собак, стремясь, чтобы собака не коснулась их предметом. По мнению Тобиаса, это не лучшее решение, т.к. для собаки исчезает конечная точка в последовательности ее действий, в качестве которой можно рассматривать прикосновение предметом к проводнику. Тобиас считает, что лучше взять на себя риск потерять 2 балла под каким-то конкретным судьей из-за этого, чем развалить упражнение.
РОЛЬ И МЕТОД КОРМЛЕНИЯ В ОБУЧЕНИИ СОБАКИ
Тобиас уделяет огромное внимание тому, каким образом собака получает еду. Основной принцип: собака еду ЗАРАБАТЫВАЕТ, как это происходит в природе. Не должно быть так, что собака один раз трудится на площадке, чтобы получить 10 кусочков еды, а вечером перед ней ставят огромную миску с едой бесплатно. Поэтому всякий раз собака получает еду за что-то. Даже когда Тобиас в поездках, он старается брать с собой свою собаку, чтобы не изменять этому принципу.
Методика кормления, в общем, следующая. Когда собака чему-то учится (в позитиве), она получает еду за демонстрацию желательного поведения. Скорость не важна. Когда навык выработан, ей предлагается показать желательное поведение с нужной (на данном этапе совершенствования) скоростью. Если все ок, собака получает еду (вплоть до своей целой миски). Если скорость или качество неудовлетворительные, еда убирается до следующего раза, когда собаке предоставляется еще один шанс. Собаке дается понять: «ресторан» работает в определенные часы и короткое время. Если не успеть, ресторан закрывается до следующего раза. Если 2-3 дня собака поголодает, она точно сообразит, что нужно быть быстрее. Разумеется, что до этого собаке должно быть совершенно понятно, что от нее требуется.
ИСПЫТАНИЯ И СОРЕВНОВАНИЯ
Очень часто собака, показывающая на тренировках практически безупречную работу, дает «сбои» на соревнованиях. Причин этому несколько:
1) Обстановка во время тренировок и на соревнованиях сильно различается. На соревнованиях всегда присутствует большое число отвлекающих факторов, которые невозможно исключить: двигающиеся люди, другие собаки, вплоть до того, что путь в зону, где проходит раздел «B», может идти мимо поля, где идет защита и т.п. Вывод – при подготовке собаки к выходу нужно как можно больше тренироваться в условиях, близких к условиям соревнований.
2) Снаряжение, которое надето на собаку. Во время обычной прогулки на собаке, как правило, минимум снаряжения (один ошейник). Во время работы (на тренировке) – множество гаджетов (ошейник, строгач, удавка, ЭШО, цепочка и др.). Поэтому, когда собаку выгружают из машины на соревнованиях в одной цепочке, она думает, что ее выпустили погулять. Из-за этого возникает конфликт ожиданий: проводник ожидает одного, собака другого. По сути, мы имеем здесь дело с классическим обусловливанием (условный рефлекс по-Павлову: связь индифферентного сигнала (вид снаряжения) с последующим поведением (прогулка или работа)).
Условно-рефлекторное обусловливание может эффективно использоваться (и используется) на соревнованиях. Например, при тренировке упражнения «разворот на 180 градусов» можно построить условный рефлекс путем изменения положения головы проводника. Если проводник идет по прямой с прямо поставленной головой, а непосредственно перед разворотом чуть наклоняет голову, то для собаки это может стать условным сигналом, что сейчас будет разворот. Нарабатывается это постепенно: сперва сигнал дается явно (заметный наклон головы) за 3 шага до разворота, затем понемногу сокращается дистанция и движение головой.
Чтобы решить проблему со снаряжением, необходимо придерживаться четкого правила: весь комплект рабочего снаряжения на собаку одевается всегда, вне зависимости от того, отправляется она гулять или работать. Если мы работаем с ЭШО и пультом к нему, пульт также необходимо брать с собой всегда – собаки очень наблюдательны.
Цепочка, в которой собака выходит на соревнования, может быть отличным маркером начала работы. Поэтому мы одеваем на собаку цепочку всякий раз перед выходом на площаку. И когда цепь будет надета перед выходом на соревнования, собака будет «включаться», в ожидании поощрения и игры. Эту связь построить достаточно просто: одеваем цепочку – клик – мяч.
Определенным снаряжением можно маркировать и другие разделы. Например, мы можем работать следовую на шлейке. Одевание шлейки станет для собаки однозначным сигналом выхода на след. А для раздела «защита» мы можем одевать ту же цепочку, что и для послушания, но, например, в машине, а не перед площадкой. Такую же связь можно создать на определенные ритуалы поведения проводника.
Реферат по итогам семинара с Тобиасом Олейником 6-7 апреля 2013 г.
Философия дрессировки Тобиаса Олейника заключается в следующем.
Все поведение собаки обусловлено двумя целями: улучшить свое положение и избежать неприятного. Собака (как, впрочем, и человек) по натуре эгоист. Если она что-то делает (или чего-то избегает), то только для личного блага. Умело комбинируя приятные и неприятные для собаки ситуации, мы способны ее эффективно обучать.
Главное в этом обучении – найти оптимальный баланс между мотивацией и концентрацией. Мотивация – это то, что заставляет собаку проявлять инициативу и активность. В обычной дрессировочной практике это еда или игрушка (добыча). Концентрация – это то, что заставляет собаку быть внимательной к проводнику все время. Концентрации мы научаем, в основном, через негативное обучение.
Обучение собаки только в негативе и излишняя дозировка негативного воздействия – неэффективны, т.к. вызывают у собаки стресс. Стресс – это физиологическое состояние, следствие резкого изменения гормонального баланса (выброса «гормонов стресса»), которое невозможно быстро скомпенсировать. 24-36 ч – это время нормализации гормонального баланса после стресса. Все это время работа с собакой, получившей сильный стресс, будет неэффективна.
Философия дрессировки Тобиаса Олейника
Обучение собаки в сильном драйве (трибе) также не дает хорошего результата. У драйвовой собаки при обучении на мяч глаза «застланы пеленой», как у женщины перед витриной с десятками пар модной обуви (сравнение Тобиаса). В таком состоянии усвоение каких-либо навыков очень неэффективно.
Поэтому основная методика обучения, которую использует Тобиас – это система НеПоПо, с пищевым подкреплением и очень дозированным негативным воздействием. Для всей базовой работы в послушании используется кликер и ошейник-удавка – это два главных инструмента. Строгий ошейник и ЭШО – это также инструменты обучения, которые дополняют базовый инструментарий. Кроме того, для работы с отдельными упражнениями используется коробка, стол, зеркала и устройство для выброса мячей.
НеПоПо (негатив-позитив-позитив) слагается из двух основных способов обучения: позитивного и негативного.
Суть ПОЗИТИВНОГО обучения:
Собака показывает нужное поведение – и получает желаемое (подкрепляется);
Собака не показывает нужное поведение – и НЕ получает желаемое.
Подкрепление должно следовать за требуемым поведением в пределах 2 с, только тогда будет установлена рефлекторная связь между подкреплением и поведением.
Ограничения позитивного обучения: им можно НАУЧИТЬ ЧЕМУ-ЛИБО, но не ОТУЧИТЬ от чего-либо.
Наиболее эффективной техникой позитивного обучения является кликер-дрессировка. Задача кликера – своевременно дать четкий и понятный сигнал собаке. Кликер может использоваться одним из способов:
А) в качестве сигнала прекращения (отмены) поведения (напр., освобождение из позиции «стоять»);
Б) в качестве маркера желательного поведения (напр., подтверждение правильной позиции «стоять»), при этом поведение должно продолжаться до тех пор, пока проводник не отменит его другим способом (командой на освобождение).
Приступая к кликер-дрессировке, нужно выбрать для себя один из указанных вариантов. Тобиас использует кликер как сигнал отмены поведения, а для маркирования желательного поведения, он применяет другие маркеры (голосовые маркеры «» и др.).
При обучении в позитиве необходимо учитывать огромную роль невербальной формф коммуникации с собакой. Собака воспринимает голосовые команды «во-вторых», а в первую очередь она читает сигналы тела проводника. Лучшей проверкой усвоения собакой вербальных команд является упражнение, когда проводник стоит спиной к собаке на расстоянии нескольких шагов и отдает ей, к примеру, команду принятия основного положения, не изменяя позу тела, рук и т.п. Если собака усвоила вербальную команду, она займет ОП быстро и точно. Поэтому если собака привыкла к помощи невербальными командами, то на соревнованиях лучше сделать подсказку языком тела и потерять немного баллов, чем «провалить» упражнение целиком.
Суть НЕГАТИВНОГО обучения:
Если собака не показывает желательного поведения, она получает негативное воздействие до тех пор, пока не начнет требуемое поведение преъявлять. Прекращение негативного воздействия уже является для собаки ПОЗИТИВОМ.
Негативное воздействие должно начинаться ОДНОВРЕМЕННО с сигналом на желательное поведение (напр., отдачей команды «зитц») и прекращаться в момент исполнения требуемого (напр., в момент плотного прикосновения собаки задом к земле).
Негативное воздействие должно быть ЧЕТКО ДОЗИРОВАННЫМ: ни излишне большим (что ведет к стрессу и «выключению» собаки), ни слишком маленьким (собака не будет стремиться его избежать). В качестве примера можно привести комара, летающего ночью над головой дремлющего человека: жужжание комара не болезненно, но оно столь неприятно, что человек стремится его прекратить. Конкретный уровень воздействия определяется собакой и ее трибом в данной ситуации.
При обучении собаки необходимо учитывать, что связь между сигналом и поведением (образование навыка) происходит через 80-120 повторений (превращение этой связи в привычку (т.е. самоподкрепляющее поведение, происходит примерно после 1000-1200 повторений – прим.мое). При обучении навыку эффективны короткие занятия (3-5 минут), в течение которого производится 2-3 подхода (повторения). Длительные, изнурительные занятия по 20-30 минут и более при обучении бессмысленны. Это можно сравнить с пустым стаканом на 200 мл, куда пытаются налить литр жидкости из бутылки – больше емкости самого стакана в него не войдет, остальное будет бесцельно пролито.
Негативная техника в системе НеПоПо научает собаку КОНЦЕНТРАЦИИ. Концентрация – это сосредоточенное и внимательное состояние собаки, исходная база обучения любому навыку. Ключ к начальному обучению концентрации – пищевое подкрепление. Еда делает собаку спокойной, раскрывает для обучения. Собака смотрит на еду в руке – и получает ее. Обучение происходит только на низком уровне возбуждения. Как только собака научилась концентрации на чем-то простом, задачу можно усложнить. И только когда собака уже усвоила все упражнение (элемент), можно переходить к повышению мотивации и разгону драйва.
Таким образом, последовательность обучения навыку, по-Тобиасу:
КОНЦЕНТРАЦИЯ -> ВЫРАБОТКА НАВЫКА -> ДРАЙВ
Еще одно условие эффективного обучения: у собаки должен быть резерв в ее мотивации. Нельзя сразу давать ей лучшее (наиболее желаемое). Лучшее она получает за лучшее выполнение. Для драйвовой добычной собаки мяч – только за лучшую (быструю и четкую) работу.
СЛИШКОМ МНОГО ПРИНУЖДЕНИЯ, СЛИШКОМ ВЫСОКАЯ ДОЗИРОВКА И СЛИШКОМ МНОГО СТРЕССА – ЭТО ТУПИКОВЫЙ ПУТЬ
При обучении желательному поведению нужно: много повторов, низкая дозировка негатива.
При отучении от нежелательного поведения нужно: более высокая дозировка негатива, но меньше повторов. Тобиас считает, что 8-10 эффективных воздействий достаточно, чтобы прекратить нежелательное поведение. Но в спорте главное – научать, а не отучать.
Ранее собаку обучали так: до года собака училась в позитивном методе. Если она отвлекалась, следовала подсказка и положительное подкрепление. В год собаке надевали строгач и заменяли им подсказку. Но собака ранее не была научена этому воздействию, ни толком самому навыку. Поэтому более действенно с самого начала использовать комбинацию позитивного и негативного способов обучения.
Кусочком корма можно мотивировать собаку сделать что-то желаемое проводником, но нельзя предотвратить погони за зайцем, если он встретится на пути. Обучение в позитиве исключает физический контакт с собакой: собака сама демонстрирует нужное поведение, которое затем подкрепляется. Но чтобы избавиться от нежелательного поведения, его нельзя избежать поощрением, и его нельзя убрать игнорированием.
Преимущества позитивного метода обучения – мотивация и положительные эмоции, недостаток – ненадежность. Преимущества негативного метода – надежность, стабильность поведения, недостаток – стресс при неправильно выбранной дозировке негативного воздействия, а также отсутствие драйва у собаки.
НеПоПо, таким образом, комбинирует оба этих способа:
1 фаза – негативное воздействие;
2 фаза – прекращение негативного воздействия = позитив для собаки;
3 фаза – подкрепление (позитив).
Эта техника может быть проиллюстрирована на отработке корректного ОП. Движение рядом лучше начинать формировать из уже сделанного корректного основного положения.
На первом этапе собака высаживается сбоку от проводника, в подмышку проводник кладет мешочек с кормом или игрушку, которые используются не как поощрение, а как точка концентрации (фокус). Поводок у проводника в левой руке. После отдачи команды следует легкое воздействие поводком (натяжение), которое прекращается, как только собака соберет взгляд в точке фокусировки. В этот момент воздействие прекращается, проводник радостно хвалит собаку (маркирует правильное поведение). После короткой паузы выпадает мячик или дается еда (второе поощрение). На данном этапе собака может сколь угодно долго смотреть в другую сторону, мы ждем, пока она выберет правильное поведение сама.
На втором этапе собака высаживается под небольшим углом (для начала 25-30 градусов) к проводнику, но ее правая передняя лапа должна быть на уровне ноги проводника (чтобы собака училась доворачивать заднюю часть корпуса, а не крутилась целиком). Схема работы та же, что и на предыдущем этапе: команда -> воздействие поводком –> прекращение воздействия после занятия корректной позиции и концентрации в точке фокусировки -> отмена воздействия -> поощрение. Если собака «тупит» и не понимает, что он нее требуется, на данном этапе можно ввести подсказку – небольшой поворот корпуса проводника от собаки (чтобы побудить ее начать доворачиваться к проводнику) или легкие (маркирующие) рывочки поводком за строгач.
На третьем этапе начинается движение – сперва полшага, потом шаг, два и т.д. Воздействие поводком начинается только тогда, когда собака отклоняет голову от правильного положения.
В качестве средства негативного воздействия при непосредственном контакте с собакой лучше, в основном, использовать удавку, а не парфорс. Строгач способствует возбуждению, повышению драйва, а удавка, наоборот, успокаивает (конечно, если не тянуть за нее со всей дурью). Удавка позволяет создать четкое и ровное воздействие, более понятное для собаки. Строгач можно использовать для серии коротких воздействий (рывочков) небольшой интенсивности, которые зачастую действуют как подсказка. И еще раз необходимо подчеркнуть: негативное воздействие начинается с сигнала (в момент обучения связи «сигнал-действие» – после него, в момент закрепления навыка – одновременно с ним) и заканчивается ровно в тот момент, когда собака сделала, что требуется (напр., плотно прижала зад к земле при команде «сидеть»).
БАЗОВОЕ ОБУЧЕНИЕ СОБАКИ
Базовое обучение собаки в технике НеПоПо начинается с работы на столе в обучении статическим командам «сидеть», «лежать», «стоять». Эти упражнения, с одной стороны, научают собаку концентрации, с другой, являются универсальными в плане методики всех прочих упражнений и, наконец, тренируют навыки конкретных элементов послушания. Некоторое время назад работали только над позициями «сидеть» и «лежать». Сегодня сразу начинают работать и с позицией «стоять», хотя она нужна только для IPO-3. Делается так потому, что если позже начинать работать с позицией «стоять», то другие навыки часто разрушаются. Работу проводят с кликером.
Обучение проходит через следующие этапы:
Приучение к столу. Собаке объясняют, что стол – это хорошо. Для этого ее кормят со стола. Цель – добиться спокойного, бесстрессового отношения к инструменту обучения. Когда собака спокойна, ее ставят на стол и кормят на нем с руки, с разных сторон стола. Для предотвращения падения поводок пристегивают к верхней перекладине над столом. Конечная цель данного этапа – спокойное поведение собаки на столе и внимание к руке с кормом.
Далее собаку научают принимать три статических позиции по сигналу, которым является легкое нажатие пальцем на соответствующие точки тела: лежать – на круп, сидеть – на холку, стоять – на нижнюю часть живота. Нажатие делают одновременно с наведением: когда собака сконцентрирована на руке с кормом, производится нажатие (негативное воздействие), с одновременным движением маркера, которое облегчает занятие нужного положения. Как только собака, например, легла, нажатие прекращается, далее клик – и скармливается кусочек. Постепенно увеличивают время концентрации собаки на маркере (руке с едой) и уменьшают силу воздействия. Конечная цель – добиться концентрации собаки на руке в течение 10 с, а давление в точке свести к легкому прикосновению пальцем. В некоторых случаях, если собака начинает сильно реагировать на движение рук, меняя позу, можно сигнал давать не пальцем, а кончиком стека.
Как только навык на столе сформирован, он переносится на землю. Первичная цель – воспроизведение навыка так же, как и на столе. На этом этапе удобно использовать коробку, которая ограничивает подвижность собаки и не дает ей смещаться. Основная задача этого этапа – начать удаляться от собаки, для чего сигнал нужно заменить с нажатия пальцем (мануальный контакт) в натяжение поводка. Делается это строго в соответствии с принципом формирования условного рефлекса: дается легкое натяжение поводка, потом следует нажатие на точку, после занятия собакой нужной позы и концентрации – клик и подкрепление. Обычно используют следующие направления натяжения поводка: сидеть – вверх, лежать – вниз, стоять – вперед. Как только поводок становится сигналом, мануальный контакт прекращают.
На этом этапе проводник отдаляется от собаки на 2-3 шага и работает с поводком и вводит словесную команду. Задача – обеспечить связь со словесной командой и работу на удалении от собаки. Техника аналогична этапу 3: команда – воздействие поводком – желательное поведение и концентрация – подкрепление. Как только собака начала реагировать на словесную команду (это достигнуто, когда собака начинает реагировать на команду еще до движения поводком), команду и натяжение совмещают по времени (до этого команда раньше на 0,5-1,5 с для образования рефлективной связи).
Образование связи между сигналом и поведением возникает через 80-100 повторений (если все делать правильно).
Для работы с собакой на удалении незаменим ЭШО. ЭШО и кликер – инструменты обучения, имеющие одинаковые важные свойства: супертайминг (возможность точного по времени воздействия) и супердозировку (воздействие не зависит от субъективных ощущений проводника, как например, при работе со строгачом, когда в разных ситуациях проводник может дать совершенно разную силу воздействия, которая ему кажется одинаковой). Перед применением ЭШО собака должна быть научена мануальному (механическому) воздействию, т.к. его следует вводить после этапа (2). Введение ЭШО происходит точно так же, как и введение поводка. (Т.к. воздействие ЭШО не направлено (не имеет вектора силы), то оно должно вводиться после четкого усвоения навыка на механике – прим. мое.)
При обучении упражнению «основное положение» ЭШО следует вводить только после отработки этапа с натяжением поводка, и не ранее.
ОБУЧЕНИЕ ПЛОТНОМУ УДЕРЖАНИЮ ПРЕДМЕТА ПРИ АПОРТИРОВКЕ
Наиболее частыми проблемами в апортировке являются жевание предмета (и/или неплотное удержание) и замедление собаки в нескольких метрах от проводника при подноске предмета. Эти проблемы обусловлены стрессом, который получает собака от проводника в процессе тренировок, когда за неплотное удержание, кривую посадку и т.п. проводник корректирует собаку во фронтальной позиции. Можно привести хороший пример: когда молодая собака приходит на площадку и «открывает для себя» стойку с апортами, то нередко она хватает апортировочный предмет и носится радостно с ним по площадке, не демонстрируя ни малейшего намека на жевание; и всего через пару-тройку месяцев эта же собака сидит с предметом перед проводником и жует. Причина – стресс.
Техника НеПоПо позволяет научить собаку плотному крепкому удержанию предмета и обеспечить отсутствие психологического конфликта с проводником во фронтальной позиции.
На первом этапе собаку приучают удерживать в пасти пластиковую трубку подходящего диаметра. Пластик используется для того, чтобы не создать нежелательной ассоциации с деревянной поверхностью, если что-то пойдет не так. Удобнее всего начинать работу на столе.
Собаку фиксируют ошейником, закрепленным к вертикальной боковой стойке, и перекинутым через корпус в районе задних ног поводком (поводок перекидывается через верхнюю штангу и фиксируется) так, чтобы собака не была подвешенной, но не имела возможности сесть или гулять по столу. Фиксация проводится в спокойной обстановке, при необходимости, с подкормкой, чтобы исключить возникновение стресса. Когда собака успокоилась и концентрируется на стоящего перед ее мордой проводника, проводник двумя пальцами левой руки раздвигает челюсти собаки и вкладывает ей в пасть трубку; при этом должно последовать одновременное дозированное натяжение поводка, который пристегнут к удавке под нижней челюстью собаки. Как только собака продемонстрировала намек на удержание предмета, натяжение прекращается, – клик – подкрепление. Это повторяется несколько раз, задача – объяснить собаке, что нужно взять трубку и совсем чуть-чуть ее подержать, и это приятно (т.к. когда она держит предмет, прекращается неприятное натяжение, а затем следует приятное подкрепление).
Постепенно увеличивается время, в течение которого собака должна удерживать предмет – от буквально 0,5 с до полуминуты. Если собака начинает жевать предмет, приоткрывает пасть или выплевывает трубку (проводник должен постараться ее подхватить), то незамедлительно следует дозированное, но неприятное натяжение, которое продолжается до тех пор, пока предмет плотно не будет удерживаться в пасти. Как только это усвоено, переходят к следующему этапу.
На втором этапе работа переносится на землю. Сперва отрабатывают все то же, что и на столе, с трубкой. Задача – получить нужное поведение собаки во фронтальной позиции перед проводником. Плотность удержания усиливают провокацией – попыткой выдернуть предмет из пасти влево или вправо. Если это получается, следует натяжение, которое прекращается после плотного и крепкого удержания предмета.
Далее работа ведется уже с апортировочным предметом с боковиной на магните. Техника та же. После наработки навыка крепость удержания усиливают, периодически пытаясь выдернуть предмет в сторону (убедитесь, что боковина предмета достаточно легко «отстегивается», чтобы не травмировать пасть и не сломать зубы).
В дальнейшем эта техника включается в апортировочный комплекс. Скорость апортировки нарабатывается с ЭШО, который используется как негативное воздействие до конечной точки – высадки собаки в ФП с крепко удерживаемым предметом.
Дискуссионный вопрос возникает в связи с требованием к упражнению апортировки - не упираться предметом проводника (в последней редакции FCI). Многие проводники сейчас переучивают собак, стремясь, чтобы собака не коснулась их предметом. По мнению Тобиаса, это не лучшее решение, т.к. для собаки исчезает конечная точка в последовательности ее действий, в качестве которой можно рассматривать прикосновение предметом к проводнику. Тобиас считает, что лучше взять на себя риск потерять 2 балла под каким-то конкретным судьей из-за этого, чем развалить упражнение.
РОЛЬ И МЕТОД КОРМЛЕНИЯ В ОБУЧЕНИИ СОБАКИ
Тобиас уделяет огромное внимание тому, каким образом собака получает еду. Основной принцип: собака еду ЗАРАБАТЫВАЕТ, как это происходит в природе. Не должно быть так, что собака один раз трудится на площадке, чтобы получить 10 кусочков еды, а вечером перед ней ставят огромную миску с едой бесплатно. Поэтому всякий раз собака получает еду за что-то. Даже когда Тобиас в поездках, он старается брать с собой свою собаку, чтобы не изменять этому принципу.
Методика кормления, в общем, следующая. Когда собака чему-то учится (в позитиве), она получает еду за демонстрацию желательного поведения. Скорость не важна. Когда навык выработан, ей предлагается показать желательное поведение с нужной (на данном этапе совершенствования) скоростью. Если все ок, собака получает еду (вплоть до своей целой миски). Если скорость или качество неудовлетворительные, еда убирается до следующего раза, когда собаке предоставляется еще один шанс. Собаке дается понять: «ресторан» работает в определенные часы и короткое время. Если не успеть, ресторан закрывается до следующего раза. Если 2-3 дня собака поголодает, она точно сообразит, что нужно быть быстрее. Разумеется, что до этого собаке должно быть совершенно понятно, что от нее требуется.
ИСПЫТАНИЯ И СОРЕВНОВАНИЯ
Очень часто собака, показывающая на тренировках практически безупречную работу, дает «сбои» на соревнованиях. Причин этому несколько:
1) Обстановка во время тренировок и на соревнованиях сильно различается. На соревнованиях всегда присутствует большое число отвлекающих факторов, которые невозможно исключить: двигающиеся люди, другие собаки, вплоть до того, что путь в зону, где проходит раздел «B», может идти мимо поля, где идет защита и т.п. Вывод – при подготовке собаки к выходу нужно как можно больше тренироваться в условиях, близких к условиям соревнований.
2) Снаряжение, которое надето на собаку. Во время обычной прогулки на собаке, как правило, минимум снаряжения (один ошейник). Во время работы (на тренировке) – множество гаджетов (ошейник, строгач, удавка, ЭШО, цепочка и др.). Поэтому, когда собаку выгружают из машины на соревнованиях в одной цепочке, она думает, что ее выпустили погулять. Из-за этого возникает конфликт ожиданий: проводник ожидает одного, собака другого. По сути, мы имеем здесь дело с классическим обусловливанием (условный рефлекс по-Павлову: связь индифферентного сигнала (вид снаряжения) с последующим поведением (прогулка или работа)).
Условно-рефлекторное обусловливание может эффективно использоваться (и используется) на соревнованиях. Например, при тренировке упражнения «разворот на 180 градусов» можно построить условный рефлекс путем изменения положения головы проводника. Если проводник идет по прямой с прямо поставленной головой, а непосредственно перед разворотом чуть наклоняет голову, то для собаки это может стать условным сигналом, что сейчас будет разворот. Нарабатывается это постепенно: сперва сигнал дается явно (заметный наклон головы) за 3 шага до разворота, затем понемногу сокращается дистанция и движение головой.
Чтобы решить проблему со снаряжением, необходимо придерживаться четкого правила: весь комплект рабочего снаряжения на собаку одевается всегда, вне зависимости от того, отправляется она гулять или работать. Если мы работаем с ЭШО и пультом к нему, пульт также необходимо брать с собой всегда – собаки очень наблюдательны.
Цепочка, в которой собака выходит на соревнования, может быть отличным маркером начала работы. Поэтому мы одеваем на собаку цепочку всякий раз перед выходом на площаку. И когда цепь будет надета перед выходом на соревнования, собака будет «включаться», в ожидании поощрения и игры. Эту связь построить достаточно просто: одеваем цепочку – клик – мяч.
Определенным снаряжением можно маркировать и другие разделы. Например, мы можем работать следовую на шлейке. Одевание шлейки станет для собаки однозначным сигналом выхода на след. А для раздела «защита» мы можем одевать ту же цепочку, что и для послушания, но, например, в машине, а не перед площадкой. Такую же связь можно создать на определенные ритуалы поведения проводника.