ВВЕДЕНИЕ
ГЛАВА 1 ТЕКСТ, ОПРЕДЕЛЕНИЕ И ОСНОВНЫЕ ХАРАКТЕРИСТИКИ
1.1 Понятие «текст» и основные характеристики текста
1.2 Понятие текста в лингвистике и в психолингвистике
1.3 Понятие текста в психолингвистике
ГЛАВА 2 ПСИХОЛОГИ, ПСИХОЛИНГВИСТЫ И ЛИНГВИСТЫ О ПРОЦЕССЕ СОЗДАНИЯ ТЕКСТА
2.1 Процесс порождения текста
2.2 Лингвистика текста и фонология
2.3 Подходы к описанию текста
2.4 Механизмы восприятия текста
2.5 Восприятие текста на примере анализа художественного текста
ГЛАВА 3 ПОДХОДЫ К ПОРОЖДЕНИЮ ТЕКСТОВ КОМПЬЮТЕРОМ
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
Современные исследования текста не ограничиваются исключительно анализом текста как объекта лингвистического исследования. За счет привлечения ряда наук, смежных с лингвистикой, текст получает новую интерпретацию. Также текст является объектом исследования психолингвистики. Многие ученые и исследователи занимаются исследованием текста.
В эпоху развития информационных и коммуникационных технологий и их внедрения во все сферы человеческой деятельности проблема автоматического порождения текстов приобрела особую актуальность, по причине количества информации, представленной в электронном виде. Актуальность современных исследований также связана с популяризацией предпринимательской деятельности в Республике Беларусь, расширением и углублением деловых контактов как внутри страны, так и за ее пределами, формированием новых форм деловой коммуникации, вызванных глобальным развитием Интернета, необходимостью быстрого ввода, обработки и обмена текстовой информацией. Таким образом, обращение к данной проблеме диктуется потребностью создания компьютерных систем, призванных помочь специалистам, работающим в сфере экономических и внешнеторговых отношений, сократить время на обработку текстов, а также снизить количество ошибок.
Актуальность работы обусловлена повышенным интересом современных исследователей к данной проблеме. Особый интерес, данный объект получает в исследованиях в рамках смежных с лингвистикой наук, в частности в психолингвистике.
Цель исследования: Проанализировать механизмы порождения и восприятия текста компьютером.
Задачи исследования:
1) раскрыть понятие «текст», рассмотреть основные характеристики текста, подходы к его исследованию, а также различия в толковании текста в лингвистике и текста в психолингвистике;
2) продемонстрировать на примере механизмы восприятия и порождения текста.
В словаре лингвистических терминов дается определение термина «текст». Текст (от лат. Textus- ткань, сплетение) - в лингвистике понимается как продукт речевой деятельности, относящийся к «речи» в ее противопоставлении «языку» [1, с 226]. Текст обладает определенной прагматической установкой, жанровой и стилистической принадлежностью, специфическими внутренними и внешними связями, характеризуется связностью и цельностью. Представляет собой предмет изучения ряда специальных дисциплин (лингвистика текста, психолингвистика; применительно к письменным художественным текстам - текстология, поэтика, риторика, герменевтика и другие), исследующих различные аспекты структуры и функционирования текста.
В современной лингвистике понятие «текст» как многогранное и разноплановое явление, как продукт устной или письменной речи, представляющий собой «последовательность вербальных знаков», становится полноправным объектом лингвистических исследований. Однако до настоящего времени не существует однозначного определения понятия «текст» вследствие существования различных текстовых форм и типов и в силу многоплановости его структурно-семантической и коммуникативно-смысловой организации.
По замечанию Е.С. Кубряковой, сведение всего множества текстов в единую систему так же сложно, как обнаружение за всем этим множеством того набора достаточных и необходимых черт, который был бы обязательным для признания текста образующим категорию классического, аристотелевого типа [13, с.72-81]. В соответствии с этим обратимся к изучению взглядов исследователей на данный термин. И.Р. Гальперин дает следующее определение понятию «текст»: «текст – это произведение речетворческого процесса, обладающее завершенностью, объективированное в виде письменного документа произведение, состоящее из названия (заголовка) и ряда особых единиц (сверхфразовых единств), объединенных разными типами лексической, грамматической, логической, стилистической связи, имеющее определенную целенаправленность и прагматическую установку» [7, с. 18-19].
Исходя из данного определения, мы отмечаем, что исследователь ведет речь о реализации текста только в письменной форме. Данного взгляда придерживаются и другие лингвисты. Однако большинство лингвистов полагает, что текстом, как понятием коммуникативным, ориентированным на выявление специфики определенного рода деятельности, являются любые речевые произведения. Текст понимается как речевая реализация авторского
В самом общем плане порождение речи есть операция перехода «смысл — текст», причем это соотношение встраивается в более широкую схему. Принято считать, что при построении высказывания человек отбирает слова из словаря и затем комбинирует их по правилам грамматики данного языка. Однако эта схема плохо согласуется с положением об уровневом характере речевой деятельности. Процесс построения высказывания управляется семантическим уровнем, на котором представлена основная смысловая структура будущего высказывания. Этот вывод подтверждают данные экспериментальных исследований. Например, рассмотрев эксперимент Б.Ю. Нормана, в котором каждый информант получил отдельный листок с заданием: «Переписать каждое предложение целиком, вставив в него в любом месте (один раз) любое слово». Далее последовал список из 10 простых предложений типа «Кукушки не вьют гнезд. Вчера отец водил Петьку на осмотр к врачу. Редактор еще раз взглянул на посетителя поверх очков». Все эти примеры были подобраны с таким расчетом, чтобы структура простого двусоставного глагольного предложения в русском языке была представлена с достаточным разнообразием.
Как выделил Б.Ю. Норман, что исходной для эксперимента («нулевой») гипотезой было то, что все члены высказывания имели примерно равные шансы на распространение. В частности, первое предложение в одних ответах могло получить вид. Многие кукушки не вьют гнезд, в других кукушки никогда не вьют гнезд, в-третьих - кукушки не вьют постоянных гнезд и т. п.
В ходе эксперимента Б.Ю. Нормана выяснилось, что в своих ответах информанты стремились не просто лексически обогатить фразу, но развить ее грамматическую структуру. Среди слов-вставок почти не встречалось отдельных (изолированных) союзов, частиц и прочих неполнозначных слов, а также вводных, вставных и обособленных членов. Отмечалось расширение структуры высказывания за счет подстановки однородного члена к уже имеющемуся (менее чем в 2% ответов). Из этого Б.Ю. Норман сделал вывод, что в высказывание вставлялось не слово как таковое, а словоформа, призванная выполнять определенную синтаксическую роль и к тому же занимающая в «дереве подчинения» высказывания определенную позицию. Ученый доложил, что испытуемые ощущали синтаксическое строение фразы и стремились вставить словоформу по возможности ближе к ее (фразы) структурной вершине и, следовательно означает, что по направлению от
Проблемами порождения текстов с помощью компьютеров исследователи занимаются с начала 70-х гг. За прошедшие годы по этим проблемам написано большое число книг, сборников и статей в различных журналах. Вопросам генерации текстов уделяют много внимания известные журналы. Например, «Artificial Intelligence Review», «Computational Linguistics», «International Journal of Human – Computer Studies», «Information Processing in Mind and Machine» и др. Ежегодно в разных странах мира по этим проблемам проводятся крупные конференции. Известнейшие университеты мира занимаются исследованиями по порождению текстов. Среди них Эдинбургский университет в Шотландии, Массачусетский, Стэнфордский, Колумбийский университеты в США, Монреальский университет и университет в Торонто (Канада) и много других. Тем не менее, до сих пор нет единой теории текстообразования, и эта теория находится в стадии становления [2, с. 33].
Проблема порождения связного текста очень сложна, поскольку текст является результатом 3взаимодействия большого числа факторов — лингвистических, психологических, логических, физиологических. В целом, технологии порождения прозаических текстов компьютером можно разделить на две большие группы: шаблонные технологии и лингвистически мотивированные технологии [1, с.66]. Шаблонные технологии относительно просты, надежны и находят широкое промышленное применение.
Самые простые шаблонные системы и грамматические знания о языке. Порожденные тексты выглядят вполне естественно, т.к. представляют собой последовательность фрагментов готового текста. Однако необходимо отметить, что подобные системы работают только с очень жесткими типами текстов. Использование шаблонов при порождении текста компьютером эффективно и целесообразно тогда, когда заранее известна структура порождаемого текста и существует возможность заранее определить его лексическое наполнение.
Системы, созданные на основе лингвистически мотивированных технологий ценны тем, что позволяют генерировать тексты с относительно свободным содержанием, которое не может быть задано при помощи готовых фрагментов текста. В данном случае источником содержания порождаемого текста являются данные, представленные в виде баз данных, баз знаний или выражений на формализованных языках. Тип входных данных не всегда предсказывает тип выходного текста, поэтому последний определяется извне пользователем. Подобные системы создают тексты одного типа, но в разных предметных областях, или в одной предметной области, но на разных языках.
Процесс понимания начинается с поисков общего смысла сообщения, с выдвижения гипотез и лишь потом переходит на более низкие уровни - сенсорные (распознавание звуков), лексический (восприятие отдельных слов) и синтаксический (восприятие смысла отдельных предложений). То есть реальный процесс понимания текста не совпадает с тем порядком, в котором поступает информация. Поэтому адекватное осмысление сообщения может иметь место только тогда, когда между указанными уровнями осуществляется обратная связь, когда «все уровни взаимообусловливаются и взаимоконтролируются. И можно добавить, что современные исследования текста не ограничиваются исключительно анализом текста как объекта лингвистического и психолингвистического исследования. За счет привлечения ряда наук, смежных с лингвистикой и психолингвистикой, текст получает новую интерпретацию. Многие ученые и исследователи занимаются исследованием текста.
Известны многочисленные подходы к процедуре порождения текстов. Зависят они в основном от того, для какой цели создается текст. Большая часть таких алгоритмов связана с созданием различного рода диалоговых систем, используемых в справочных и обучающих системах. Следующая группа разработок имеет целью проверку различных лингвистических и литературоведческих теорий порождения предложения, абзаца, текста. Значительная часть работ направлена на генерацию практических документов (метеосводок, статистических отчетов о занятости населения, инструкций по регулировке механизмов и т.д.) или же небольших газетных сообщений о текущих событиях. В Минском государственном лингвистическом университете также ведутся работы по моделированию на компьютере процессов текстообразования. Созданы алгоритмы и программы порождения французских сказок, английских и французских рекламных текстов, пословиц и поговорок. Заканчивается работа по порождению на компьютере англоязычных электронных деловых писем.
1. Ахманова О. С. Словарь лингвистических терминов. М., 1966; 2-е изд. М., 1969.
2. Баранов А.Г. Прагматика как методологическая перспектива языка. – Краснодар: Просвещение-Юг, 2008. – 188 с.
3. Брандес М.П. Синтаксическая семантика текста. М., 1977.
4. Болдасов, М.В. Генерация текстов на естественном языке — теории, методы, технологии / НТИ. Сер. 2 Информационные процессы и системы. — 2006. — № 7. — С. 12–22.
5. Бусел, Т.В. О лингвистически мотивированных подходах к проблеме генерации текстов на естественном языке / Вестн. МГЛУ. Сер.1, Филология. — 2009. № 2. — С. 170– 178.
6. Валгина Н.С. «Теория текста». - М.: Логос, 2003г.
7. Гальперин И.Р. Текст как объект лингвистического исследования // УРСС Эдиториал ,2006.
8. Гинзбург Л.Я. К вопросу об интерпретации текста // Структура текста-81: Тезисы симпозиума / Под ред. Вяч. Вс. Иванова и др. – М.: Институт славяноведения и балканистики АН СССР, 1981.
9. Зиндер Л.Р., «Пособие по теоритической грамматике и лексикологии».- М.: 1985.
10. Зубов А. В "Порождение текстов компьютером"
11. Кириллов Н.Б. «Словарь лингвистических терминов», 1840.
12. Концевая Л.А. «Анализ художественного текста школьниками 7 классов».- М., 1978.
13. Кубрякова Е.С. Текст и его понимание // Русский текст, 1994, № 2.
14. Кулибина Н. В. «Художественный текст в лингводидактическом осмыслении. Диссертация». - М., 2001.
15. Ларин Б. А. «Эстетика слова и язык писателя»: Сб. статей. Л., 1974.
16. Литвинов В.П. Мышление по поводу языка в традиции Г.П. Щедровицкого // Познающее мышление и социальное воздействие. Наследие Г.П. Щедровицкого в контексте отечественной и мировой философской мысли. – М.: Ф.А.С.-медиа, 2004.
17. Лотман Ю.М. Избранные статьи. Т. 1. – Таллинн: Александра, 1992.
18. Лурия А.Р. Язык и сознание. – М.: Наука, 1998. – С. 230.
19. Москальская О.И. «Грамматика текста». - М., 1981.
20. Серебрякова С.В. Концептуальная значимость заглавия в переводческом аспекте // Язык. Текст. Дискурс: Научный альманах. – Вып. 6. – Ставрополь-Краснодар: СГУ, КГУ, 2008.
21. Смирнов А.В.. Логика смысла. М., 2001.
22. Филиппов К.А. «Лингвистика текста: Курс лекций».- СПб.: Изд-во С.-Петерб. университета, 2003. – 336с.
23. Черкасова И.П. Лингвокультурный концепт «ангел» в пространстве художественного мышления: Монография. – Армавир: АГПУ, 2005.
24. Чернявская В.Е. «Лингвистика текста: Поликодовость, интертекстуальность, интердискурсивность». Учебное пособие.- М.: Книжный дом «ЛИБРОКОМ», 2009. – 248с.
25. Штайн К.Э. Предисловие // Текст. Узоры ковра: Сб. Статей научно-методического семинара «TEXTUS». Вып. 4. Часть 1. Общие проблемы исследования текста. – Спб-Ставрополь: СГУ, 1999.