Что значит реферирование текста на английском
Реферирование статьи на английском
Говоря научным языком, реферирование статьи на английском довольно сложное дело с первого взгляда. Но на самом деле это не так. Если вы дочитаете до конца, то это занятие покажется сущим пустяком, а может даже очень увлекательным занятием. Ведь любой автор пишет не просто так, а с каким-то смыслом, проводит какую-то мысль и идею. Увидеть это вас никто не научит. Все зависит от вашего личного умения. А вот грамотно преподнести всю структуру — это, пожалуйста.
Как составлять анализ текста на английском языке?
Для начала давайте разберемся, в чем суть реферирования статьи на английском. Это не просто краткое содержание, пересказ, а анализ. Вам необходимо выделить главную идею, описать главных героев или события, факты. Для всего этого есть вводные структуры, которые необходимо знать. Итак, с чего начать и чем закончить? Мы приведем вам в пример несколько фраз. А вы выбирайте наиболее понравившиеся.
1. Название статьи, автор, стиль.
The article I’m going to give a review of is taken from… — Статья, которую я сейчас хочу проанализировать из…
The headline of the article is — Заголовок статьи…
The author of the article is… — Автор статьи…
It is written by — Она написана …
The article under discussion is … — Статья, которую мне сейчас хочется обсудить, ….
The headline foreshadows… — Заголовок приоткрывает
2. Тема. Логические части.
The topic of the article is… — Тема статьи
The key issue of the article is… — Ключевым вопросом в статье является
The article under discussion is devoted to the problem… — Статью, которую мы обсуждаем, посвящена проблеме…
The author in the article touches upon the problem of… — В статье автор затрагивает проблему….
I’d like to make some remarks concerning… — Я бы хотел сделать несколько замечаний по поводу…
I’d like to mention briefly that… — Хотелось бы кратко отметить…
I’d like to comment on the problem of… — Я бы хотел прокомментировать проблему…
The article under discussion may be divided into several logically connected parts which are… — Статья может быть разделена на несколько логически взаимосвязанных частей, таких как…
3. Краткое содержание.
The author starts by telling the reader that — Автор начинает, рассказывая читателю, что
At the beginning of the story the author — В начале истории автор
touches upon — затрагивает
makes a few critical remarks on — делает несколько критических замечаний о
The story begins (opens) with a (the)
description of — описанием
introduction of — представлением
the mention of — упоминанием
the analysis of a summary of — кратким анализом
the characterization of — характеристикой
(author’s) opinion of — мнением автора
author’s recollections of — воспоминанием автора
the enumeration of — перечнем
The scene is laid in … — Действие происходит в …
The opening scene shows (reveals) … — Первая сцена показывает (раскрывает) …
We first see (meet) … (the name of a character) as … — Впервые мы встречаемся с (имя главного героя или героев)
In conclusion the author
dwells on — останавливается на
points out — указывает на то
mocks at — издевается над
4. Отношение автора к отдельным моментам.
The author gives full coverage to… — Автор дает полностью охватывает…
The author outlines… — Автор описывает
The article contains the following facts…./ describes in details… — Статья содержит следующие факты …. / подробно описывает
The author starts with the statement of the problem and then logically passes over to its possible solutions. — Автор начинает с постановки задачи, а затем логически переходит к ее возможным решениям.
The author asserts that… — Автор утверждает, что …
The author resorts to … to underline… — Автор прибегает к …, чтобы подчеркнуть …
Let me give an example… — Позвольте мне привести пример …
5. Вывод автора.
In conclusion the author says / makes it clear that…/ gives a warning that… — В заключение автор говорит / проясняет, что … / дает предупреждение, что …
At the end of the story the author sums it all up by saying … — В конце рассказа автор подводит итог всего этого, говоря …
6. Выразительные средства, используемые в статье.
To emphasize … the author uses… — Чтобы акцентировать внимание … автор использует
To underline … the author uses… Чтобы подчеркнуть … автор использует
To stress… — Усиливая
Balancing… — Балансируя
7. Ваш вывод.
Taking into consideration the fact that — Принимая во внимание тот факт, что
The message of the article is that /The main idea of the article is — Основная идея статьи (послание автора)
In addition… / Furthermore… — Кроме того
On the one hand…, but on the other hand… — С одной стороны …, но с другой стороны …
Back to our main topic… — Вернемся к нашей основной теме
To come back to what I was saying… — Чтобы вернуться к тому, что я говорил
In conclusion I’d like to… — В заключение я хотел бы …
From my point of view… — С моей точки зрения …
My own attitude to this article is… — Мое личное отношение к
I fully agree with / I don’t agree with — Я полностью согласен с/ Я не согласен с
It is hard to predict the course of events in future, but there is some evidence of the improvement of this situation. — Трудно предсказать ход событий в будущем, но есть некоторые свидетельства улучшения.
I have found the article dull / important / interesting /of great value — Я нахожу статью скучной / важной/ интересной/ имеющую большое значение (ценность)
Таким образом, чтобы хорошо проанализировать статью, необходимо ее несколько раз прочитать. Первый — ознакомительный, определяете стиль, тему. Второй — обращаете внимание на детали, на поведение героев, пытаетесь кратко передать основное содержание. Затем опять просматриваете и ищите то, что же автор хотел донести до читателя, что он для этого использовал. Ну а затем, продумываете свое отношение к прочитанному.
Система автоматического реферирования для трех языков
Я хочу рассказать о разработанном мной сервисе реферирования новостных текстов на английском, русском и немецком языках.
Системы автоматического реферирования (резюмирования) (САР) — тема довольно специфическая и будет интересна в основном тем, кто занимается автоматической обработкой языка. Хотя идеально исполненный саммарайзер мог бы стать полезным помощником в сферах, где необходимо преодолеть информационный перегруз и быстро принять решение о том, какая информация стоит дальнейшего рассмотрения.
Как обстоит дело?
С одной стороны, в процессе поиска аналогов я заметил интересную вещь — большинство найденных мною статей, сервисов, репозиториев и пр. датируются самое позднее 2012 годом. На Хабре есть статья на тему автоматического реферирования, опубликованная в 2011 году. В этом же году новостное реферирование было последний раз включено в список треков конференции TAC.
С другой стороны, набирают популярность мобильные приложения, которые обрабатывают новостные потоки и представляют пользователю короткие рефераты на выбранные им темы. Яркий пример такой востребованности — относительно недавняя (2013 г.) покупка Google и Yahoo саммарайзеров-стартапов Wavii и Summly соответственно, а также наличие различных браузер-плагинов, реферирующих веб-страницы (Chrome, Mozilla).
Беглое же тестирование бесплатных он-лайн сервисов реферирования показывает, что большинство из них работает схоже, выдавая одинаково средние (плохие?) результаты, среди которых, пожалуй, в лучшую сторону выделяется Autosummarizer.
Зачем ещё одна САР?
Изначальная цель проекта — послужить платформой для изучения программирования в общем и программирования на python в частности. А поскольку тема компьютерной лингвистики мне близка по роду деятельности, то я выбрал реферирование в качестве объекта разработки, к тому же по нему уже имелись некоторые идеи и материалы.
Если походить по сервисам из приведённого списка, то можно увидеть, что работают они в большинстве своём с английскими текстами (если их вообще удаётся заставить функционировать). Выбрать другой язык можно в MEAD, OTS, Essential-mining, Aylien и Swesum. При этом первый не имеет веб-интерфейса, третий после 10 пробных текстов требует регистрации, а четвертый, давая возможность выставить настройки в демо, почему-то не хочет ничего реферировать.
По мере того, как у меня выходило что-то путное с обработкой английских текстов, захотелось сделать сервис, который работал бы ещё с русскими и немецкими новостными статьями и работал бы не хуже перечисленных, а также предоставить возможность сравнить разработанный алгоритм с популярными сегодня методами TextRank, LexRank, LSA и другими. К тому же, это неплохая возможность попрактиковаться с html, css и wsgi.
Где посмотреть?
Как работает?
t-CONSPECTUS — это саммарайзер экстрактного типа, т.е. он формирует реферат из предложений оригинальной статьи, которые в процессе анализа получили наибольший вес, и, следовательно, лучше всего передают смысл содержимого.
Весь процесс реферирования проводится в четыре этапа: предобработка текста, взвешивание терминов, взвешивание предложений, извлечение значимых предложений.
Во время предварительной обработки текст разбивается на абзацы и предложения, находится заголовок (понадобится для коррекции весов терминов), проводится токенизация и стемминг. Для русского и немецкого языков проводится лемматизация. Pymorhpy2 лемматизирует русские тексты, для обработки немецких пришлось написать свою функцию лемматизации на основе лексикона парсера CDG, поскольку ни NLTK, ни Pattern, ни TextBlob German, ни FreeLing не предоставляли нужного функционала, а выбранный хостинг не поддерживает Java, что исключило возможность использовать Stanford NLP.
На этапе взвешивания терминов ключевые слова определяются с помощью TF-IDF. Термин получает дополнительный коэффициент, если:
Детальное описание приводится в статье «Яцко В.А. Симметричное реферирование: теоретические основы и методика // Научно-техническая информация. Сер.2. — 2002. — № 5.»
При данном подходе вес предложения определяется как количество связей между данным предложением и предложениями, находящимися слева и справа от него. Связи – это ключевые слова, общие у данного предложения и его соседей. Сумма лево- и правосторонних связей составляет вес предложения. Есть ограничение – текст должен состоять минимум из трех предложений.
Кроме того, при расчете финального веса предложения учитывается его позиция в тексте (в новостных текстах первое предложние наиболее информативное), наличие имен собственных и цифровых последовательностей и длина предложения. Дополнительно применяется штрафной коэффициент, который понижает вес длинных предложений.
Заданное количество значимых предложений выбирается из отсортированного по убыванию весов списка, при этом извлеченные предложения на выходе расставляются в том пордке, в котором они шли в оригинале, чтобы хоть как-то соблюсти связность текста. Размер саммари по умолчанию равен 20% от объема оригинала.
Какое качество саммари?
Традиционный подход к оценке качества саммари – сравнение с человеческим рефератом. Пакет ROUGE является на сегодняшний день самым популярным инструментом для проведения такой оценки.
К сожалению, раздобыть эталоны не так-то просто, хотя, например, конференция DUC предоставляет результаты прошедших соревнований саммарайзеров, включая человеческие рефераты, если пройти ряд бюрократических процедур.
Я выбрал две метрики полностью автоматической оценки, обоснованные и описанные в п. 3 здесь (pdf), которые сравнивают саммари с оригиналом статьи. Это косинусный коэффициент (cosine similarity) и расстояние Дженсона-Шеннона (Jensen–Shannon divergence).
Расстояние Дженсона-Шеннона показывает, сколько информации будет потеряно, если заменить оригинал рефератом. Соответственно, чем ближе показатель к нулю, тем лучше качество.
Косинусный коэффициент, классический для IR, показывает насколько близки друг к другу вектора документов. Для составления векторов я использовал tf-idf слов. Соответственно, чем ближе показатель к 1, тем больше соответствует реферат оригиналу по плотности ключевых слов.
В качестве систем для сравнения были выбраны:
Таблица 1. Английский язык:
Cosine Similarity (—>1) | Jensen–Shannon divergence (—>0) | |||||||
t-CONSP | OTS | Textrank | Random | t-CONSP | OTS | Textrank | Random | |
popsci | 0.7981 | 0.7727 | 0.8227 | 0.5147 | 0.5253 | 0.4254 | 0.3607 | 0.4983 |
environ | 0.9342 | 0.9331 | 0.9402 | 0.7683 | 0.3742 | 0.3741 | 0.294 | 0.4767 |
politics | 0.9574 | 0.9274 | 0.9394 | 0.5805 | 0.4325 | 0.4171 | 0.4125 | 0.5329 |
social | 0.7346 | 0.6381 | 0.5575 | 0.1962 | 0.3754 | 0.4286 | 0.5516 | 0.8643 |
IT | 0.8772 | 0.8761 | 0.9218 | 0.6957 | 0.3539 | 0.3425 | 0.3383 | 0.5285 |
Таблица 2. Немецкий язык:
Cosine Similarity (—>1) | Jensen–Shannon divergence (—>0) | |||||||
t-CONSP | OTS | Textrank | Random | t-CONSP | OTS | Textrank | Random | |
popsci | 0.6707 | 0.6581 | 0.6699 | 0.4949 | 0.5009 | 0.461 | 0.4535 | 0.5061 |
envir | 0.7148 | 0.6749 | 0.7512 | 0.2258 | 0.4218 | 0.4817 | 0.4028 | 0.6401 |
politics | 0.7392 | 0.6279 | 0.6915 | 0.4971 | 0.4435 | 0.4602 | 0.4103 | 0.499 |
social | 0.638 | 0.5015 | 0.5696 | 0.6046 | 0.4687 | 0.4881 | 0.456 | 0.444 |
IT | 0.4858 | 0.5265 | 0.6631 | 0.4391 | 0.5146 | 0.537 | 0.4269 | 0.485 |
Таблица 3. Русский язык:
Cosine Similarity (—>1) | Jensen–Shannon divergence (—>0) | |||||||
t-CONSP | OTS | Textrank | Random | t-CONSP | OTS | Textrank | Random | |
popsci | 0.6005 | 0.5223 | 0.5487 | 0.4789 | 0.4681 | 0.513 | 0.5144 | 0.5967 |
environ | 0.8745 | 0.8100 | 0.8175 | 0.7911 | 0.382 | 0.4301 | 0.4015 | 0.459 |
politics | 0.5917 | 0.5056 | 0.5428 | 0.4964 | 0.4164 | 0.4563 | 0.4661 | 0.477 |
social | 0.6729 | 0.6239 | 0.5337 | 0.6025 | 0.3946 | 0.4555 | 0.4821 | 0.4765 |
IT | 0.84 | 0.7982 | 0.8038 | 0.7185 | 0.5087 | 0.4461 | 0.4136 | 0.4926 |
Тексты оригиналов статей и полученные саммари можно посмотреть здесь.
Здесь и здесь можно скачать сторонние пакеты для автоматической оценки качества саммари.
А что дальше?
Дальше планируется улучшать понемногу алгоритм, например, учитывать синонимы при поиске ключевых слов статьи, либо использовать для этих целей что-то типа латентного размещения Дирихле (Latent Dirichlet Allocation); решить, какие части текста нуждаются в особом взвешивании (например, нумерованные списки); попробовать добавить ещё языки и т.д. и т.п.
На самом сайте добавить в статистику показатели качества, добавить визуальное сравнение результатов «родного» алгоритма и сторонних и т.д.
Реферирование статьи на английском
В материале представлен пошаговый план реферирования английской статьи
Просмотр содержимого документа
«Реферирование статьи на английском»
1. Название статьи, автор, стиль.
The article I’m going to give a review of is taken from… — Статья, которую я сейчас хочу проанализировать из…
The headline of the article is — Заголовок статьи…
The author of the article is… — Автор статьи…
It is written by — Она написана …
The article under discussion is … — Статья, которую мне сейчас хочется обсудить, ….
2. Тема. Логические части.
The topic of the article is… — Тема статьи
The key issue of the article is… — Ключевым вопросом в статье является
The author in the article touches upon the problem of… — В статье автор затрагивает проблему….
I’d like to make some remarks concerning… — Я бы хотел сделать несколько замечаний по поводу…
I’d like to comment on the problem of… — Я бы хотел прокомментировать проблему…
3. Краткое содержание.
The story begins (opens) with a (the) description of —история начинается описанием
introduction of — представлением
In conclusion the author
4. Отношение автора к отдельным моментам.
5. Вывод автора.
6. Ваш вывод.
Реферирование статей на английском языке
1. SECRETS OF THE ANIMALS THAT DIVE DEEP INTO THE OCEAN
By Jane Palmer 15 January 2015
Discover the deepest-diving animals (Credit: Pierangelo Pirak / BBC Earth)
But it’s a challenging way to make a living. The most immediate problem is the extreme, crushing pressure. At 1000m down, a Cuvier’s beaked whale experiences 100 times the pressure that they do at the surface, enough to completely compress the air in their lungs.
But that introduces a new problem. With little oxygen in their lungs, the whales have to be thrifty when it comes to using the gas on their dives. «They are very frugal,» Fahlman says. «They’re just really, really tightly holding onto this oxygen and trying to use it as conservatively as possible.»
A Cuvier’s beaked whale (Ziphius cavirostris) (Credit: Todd Pusser / NPL)
To stop using so much oxygen, diving mammals can stop their breathing and shunt blood flow from their extremities to the brain, heart, and muscles. They also shut down digestion, kidney and liver function.
But it’s not enough to just be stingy with oxygen. Once they’re in deep water, divers like Cuvier’s beaked whales have to sneak up on, and overcome, their prey. For that, they need to find some oxygen.
Then in 2013, Berenbrink made a startling discovery about diving animals’ muscles. Like all mammals, their muscles contain a protein called myoglobin that stores oxygen and gives meat its red colour. Myoglobin is ten times more concentrated in the muscles of diving animals than it is in human muscles. It is so concentrated in whales that their flesh appears almost black.
But there should be a limit to the amount of myoglobin that muscles can contain. If too many of the molecules pack into a small space, they could stick together. Such clumping can cause serious diseases in humans, such as diabetes and Alzheimer’s. Yet Berenbrink found that diving animals’ muscles seemingly carry too much myoglobin.
Berenbrink found that all the diving mammals he studied had positively-charged myoglobin, although some had larger positive charges than others. The highest concentrations of myoglobin occur in the muscles needed for swimming, exactly where the divers need it the most. What’s more, genetic analyses suggested that beaked whales should have the highest levels of myoglobin, as we would expect.
But while Berenbrink’s work has found a veritable built-in oxygen tank in divers, he says we still don’t know whether this tank provides enough for the long dives made by beaked whales. «There is still a lot that we don’t know,» Berenbrink says.
Even if the diving mammals do have enough oxygen, they’re still not out of the woods. They must also deal with a disorder called decompression sickness, or «the bends». In humans, the bends can be fatal. And it turns out marine mammals are also at risk.
When a human scuba diver is at depth, gases dissolve in their blood. If the diver then comes up too quickly, the pressure drop causes gas bubbles to emerge from the bloodstream and get lodged in capillaries and critical organs. This causes discomfort and pain, and sometimes death.
Scientists had thought diving mammals were immune from the condition, even though they had found such bubbles before in stranded animals. Between 1992 and 2003, researchers found bubble-associated tissue injury in dolphins, porpoises and a single Blainville’s beaked whale washed up on British shores.
The turtles had been accidentally caught in commercial fishing nets and bought in by local fishermen. Of the 21 that arrived alive, 9 showed signs of spasticity. CT scans revealed bubbles in the turtles’ organs.
It’s easy to diagnose decompression sickness: simply put the animal under higher pressure and see if the symptoms clear. To that end, García placed the two smallest turtles in the lab autoclave and recompressed them using similar protocols to those used for human divers. The turtles made a full recovery and García eventually released them back into the wild.
The finding is important for efforts to conserve sea turtles. We now know that turtles caught up in fishing nets may suffer from the bends, and need treatment before being let go. If fishermen simply untangle them from the nets and release them immediately, the turtles may die of decompression sickness.
In the 2002 beaching, a series of military exercises involving sonar took place in the region just four hours earlier. Since that incident, researchers have noted the links between sonar activity and strandings of marine mammals on beaches in the Mediterranean Sea, the Canary Islands, and the Bahamas.
In theory, if whales are 1000m or 2000m down, the noise of sonar could send them rocketing up to the surface. If they came up too quickly, their anti-decompression mechanisms might not keep up. But we can’t confirm this, Fahlman says. «No one even understands how they avoid the bends, let alone how they then go on to get the bends in certain situations,» Fahlman says.
«But really what does that show?» asks Fahlman. «It doesn’t tell us anything about how the whales might behave underwater, at great depths.»
Fahlman says the only way to understand why the whales get the bends is to figure out their normal behaviour and physiology, in particular how they cope when deep diving. But that is no mean task, not least because whales are far too big to ever study in a laboratory.
These studies could have unexpected benefits, adds Fahlman. By unravelling the physiology of extreme diving, researchers may figure out how to treat certain clinical conditions in humans. One example is atelectasis, in which a person’s lungs collapse, obstructing breathing. Marine mammals’ extreme dives may point the way to a cure.
«They’re diving to depths that are absolutely phenomenal,» Fahlman says. «With our current knowledge of physiology, they’re going way over and beyond what they’re supposed to be able to do.»
The article “Secrets of the animals that dive deep into the ocean” is written by Jane Palmer 15 January 2015.
Then the author give facts: Sperm whales routinely dive between 500m and 1000m, Weddell seals go to 600m, and elephant seals can hold their breath for two hours.
After that the author goes on to say that with little oxygen in their lungs, the whales have to be thrifty when it comes to using the gas on their dives.To stop using so much oxygen, diving mammals can stop their breathing and shunt blood flow from their extremities to the brain, heart, and muscles. They also shut down digestion, kidney and liver function.
The author also the results of different reasechers: a Scientists had thought diving mammals were immune from the condition, even though they had found such bubbles before in stranded animals. Between 1992 and 2003, researchers found bubble-associated tissue injury in dolphins, porpoises and a single Blainville’s beaked whale washed up on British shores. The question was finally settled in 2013, when Daniel García-Párraga of Oceanografic in Valencia, Spain and his colleagues diagnosed the bends for the first time in live marine animals : loggerhead sea turtles. The turtles had been accidentally caught in commercial fishing nets and bought in by local fishermen. Of the 21 that arrived alive, 9 showed signs of spasticity. CT scans revealed bubbles in the turtles’ organs.
The author concludes with the words of scientist Fahlman, who says “ They’re diving to depths that are absolutely phenomenal. With our current knowledge of physiology, they’re going way over and beyond what they’re supposed to be able to do”.