토요일, 7월 23, 2022

[ASTRONOMY] 인공지능이 바꾸는 천문학의 현재와 미래

[ASTRONOMY] 인공지능이 바꾸는 천문학의 현재와 미래
아마추어 천문가의 월간지 'ASTRONOMY'의 기사 입니다. 원래 제목은 아래와 같습니다.

How artificial intelligence is changing astronomy
인공지능이 천문학을 변화시키고 있다.

Machine learning has become an essential piece of astronomers’ toolkits.
기계학습이 천문학(연구)의 중요한 도구가 되었다.
 
By Ashley Spindler | Published: Friday, July 15, 2022

출처는 아래와 같습니다.

[ https://astronomy.com/news/2022/07/how-artificial-intelligence-is-changing-astronomy ]

기사전문을 영어공부 한다는 핑계로 옮겨 봅니다.

When most people picture an astronomer, they think of a lone person sitting on top of a mountain, peering into a massive telescope. Of course, that image is out of date: Digital cameras have long since done away with the need to actually look though a telescope.

천문학자에 대해 연상되는 모습은 산 정상에 홀로 앉아 망원경을 들여다 본다고 생각할 것이다. 이제 이런 모습은 옛것이 되었다(out of date). 디지털 카메라는 망원경을 직접(actually) 들여다 볼 필요를 없애온지 오래다.

But now the face of astronomy is changing again. With the advent of more powerful computers and sky surveys that generate unimaginable quantities of data, artificial intelligence is the go-to tool for the keen researcher of space. But where is all of this data coming from? And how can computers help us learn about the universe?

이제 천문학의 얼굴[대표적인 모습]은 다시한번 변모하고 있다. 강력한 컴퓨터와 전천 관측(sky survey: 특정 관측 대상을 겨냥하지 않고 전체 하늘을 사진으로 찍음)으로 생산된 상상할 수 없을 분량의 사진자료가 유용해지자 인공지능이 우주연구자들에게 아주 유용한 도구가 되었습니다. 하지만 이 모든 자료는 어떻게 얻어질까요? 그리고 우주를 이해하는데 컴퓨터는 어떤 도움이 되나요?

[주: 고대로부터 맨눈으로 별들을 바라보다 갈릴레이가 망원경으로 관측하기 시작 하면서 천문학자의 모습이 망원경과 함께 굳어졌습니다. 이제 그 모습이 변화하는 중입니다. 천문학자들은 말하죠. 별을 더이상 안쳐다 본다고. 심지어 별자리도 잘 모른다고 대놓고 말하기도 합니다. 별을 보는대신 유명 천문대에 관측 제안서 쓰기 바쁘다는 군요. 컴퓨터 앞에서 제안서를 쓰기위해 아이디어를 짜내는 것이 오늘날 천문학자들의 연구과제가 되었습니다.]

AI's appetite for data
자료를 폭식하는 인공지능

Chances are you’ve heard the terms “artificial intelligence” and “machine learning” thrown around recently, and while they are often used together, they actually refer to different things. Artificial intelligence (AI) is a term used to describe any kind of computational behavior that mimics the way humans think and perform tasks. Machine learning (ML) is a little more specific: It’s a family of technologies that learn to make predictions and decisions based on vast quantities of historical data. Crucially, ML creates models which exhibit behavior that is not pre-programmed, but learned from the data used to train it.

"인공지능"이니 "기계학습"이니 하는 말들이 우리 주변에 넘쳐나고 안쓰이는 곳이 없습니다. 인공지능은 인간이 생각하고 행하는 방식을 따라하는(mimic) 컴퓨터의 행위라고 설명되곤 하죠. 기계학습(ML)이란 말은 이보다 좀더 구체적인데 엄청나게 쌓이 이제까지의 자료(historic data)를 바탕으로 결정을 내리고 예측하기 위해 훈련시키는 관련기술입니다.

The facial recognition in your smartphone, the spam filter in your emails, and the ability of digital assistants like Siri or Alexa to understand speech are all examples of machine learning being used in the real world. Many of these technologies are now being used by astronomers to investigate the mysteries of space and time. Astronomy and machine learning are a match made in the heavens, because if there’s one thing astronomers have too much of — and ML models can’t get enough of — it’s data.

스마트폰의 안면인식, 전자 메일에서 쓰레기 편지 걸러내기, 음성을 인식하는 시리나 알렉사 같은 디지털 조수 기능들은 모두 실생활에서 보는 기계학습의 예다. 이런 여러 기술들이 이제 우주와 시간의 기묘함을 연구하는 천문학자들에 의해 사용되고 있다. 천문학과 기계학습이 하늘에서 만났는데 한가지 이유라면 천문학자들에겐 자료가 너무 벅차고 기계학습에겐 충분치 못하기 때문이다. 

We’re all familiar with megabytes (MB), gigabytes (GB), and terabytes (TB), but data at that scale is old news in astronomy. These days, we’re interested in petabytes (PB). A petabyte is about one thousand TB, a million GB, or a billion MB. It would take around 10 PB of storage to hold every single feature-length movie ever made in 4K resolution — and it would take over a hundred years to watch them all.

우리는 메가바이트나 기가바이트, 그리고 테라바이트 같은 디지털 자료의 용량에 익숙하나 천문학에서 그정도 규모는 옛날 이야기다. 요즘의 자료는 페타바이트(PB)에 이르고 있다. 페타 바이트는 테라 바이트의 천배, 기가 바이트의 백만배 메가 바이트의 십억배에 이른다. 이제껏 4K 해상도로 만들어진(ever made) 영화들을 모두 저장하려면 10 페타 바이트의 저장공간이 필요하고 그 영화들을 모두 보려면 100년 이상 걸릴지 모른다.

The Vera C. Rubin Observatory, a new telescope under construction in Chile, will be tasked with mapping the entire night sky in unprecedented detail, every single night. Over a 10-year survey, Vera Rubin will produce about 60 PB of raw data — studying everything from asteroids in our solar system, to galaxies in the distant universe. No human being could ever hope to analyze all that data — and that’s from just one of the next-generation observatories being built, so the race is on among astronomers in every field to find new ways to leverage the power of AI.

칠레에 건설중인 새 망원경인 베라 C 류빈 천문대는 유래가 없이 구석구석(~ detail) 매일 밤마다 전 밤하늘의 관측 사진을 찍기로(~mapping) 되어있다(will be tasked)[참고]. 10년 이상 관측(~survey)하면서  베라 류빈 천문대는 약 60 페타바이트(PB) 분량의 원시 관측자료를 생산하게 된다. 우리 태양계의 모든 소행성(asteroids)들에서 먼 은하들에 이르기까지 하늘의 모든 것을 찍게 된다. 인간으로는 이 모든 자료를 분석할 엄두도 못낸다. 앞으로 건설될 차세대 천문대는 모두 그럴 것이다. 따라서 천문학자들 사이에는 인공지능의 힘을 지렛대 삼아 모든 분야에서 새로운 분석 방법을 찾는 경쟁이 치열하다.

Planet hunters
행성 찾기

One area of astronomy where AI has made a significant impact is in the search for exoplanets. There are many ways to look for their signals, but the most productive methods with current technology usually involve studying the variation of a star’s brightness over time. If a star’s light curve shows a characteristic dimming, it could be a sure sign of a planet transiting in front of the host star. Conversely, a phenomenon called gravitational microlensing can cause a large spike in a star’s brightness, when the exoplanet’s gravity acts as a lens and magnifies a more distant star along the line of sight. Detecting these dips and spikes means sifting through millions of light curves, studiously collected by space telescopes like NASA’s Kepler and TESS (Transiting Exoplanet Survey Satellite).

인공지능이 천문학분야에 큰 영향을 줄 분아 중 하나가 외계 행성(exoplanets) 탐색이다. 외계 행성의 신호를 찾는 방법은 여러 방법이 있으나 현재 기술로는 가장 생산적인 방법은 긴시간에 걸쳐 빛의 밝기 변화를 살펴보는 것이다. 말하지면 초소형 중력 렌즈(microlensing) 라고 하는 현상인데 별빛의 밝기에 급작스런 튐(spike)을 일으킨다. 행성의 중력이 렌즈처럼 작동하여 같은 시선축 뒤에 떨어진 별빛을 증폭하여 생긴다. 이런 튀어오름(spikes)과 잠김(dips)의 감지는 백만장의 광도곡선중에서 골라낸(sift: 채치다) 것이다. NASA의 케플러와 별의 앞을 횡단하는 행성 관측위성 TESS(Trasiting Exoplanet Survey Satellite) 에 의해 수집한 백만장의 광도곡선에서 세심하게(studiously) 찾아냈다.

Using the huge libraries of observed light curves, astronomers have been able to develop ML-based models that can outperform humans in the search for exoplanets. But AI can do much more than just find exoplanets: It can also lead astronomers to new insights into how those techniques work.

관측한 광도 곡선의 방대한 자료를 사용하여 천문학자들은 기계학습 기반의 모형을 개발해 왔다. 이 모형은 외계행성을 찾는데 인간의 능력을 상회한다(outperform). 게다가 인공지능은 단지 외계 행성을 찾는 것 이상의 일을 할 수 있다. 천문학자들은 이 기술들이 무슨일을 할 지 새로운 영감을 불어 넣고 있다(lead into).

An exoplanet that microlenses a background star creates a spike in brightness, which can be detected by humans or algorithms. However, because microlensing offers relatively little information about the lensing exoplanet itself, the data leave open many possibilities for the planet’s configuration with its host star — i.e. its mass and how closely it orbits its host star. Previously, astronomers had identified multiple ways in which different configurations of star and planet could produce the same microlensing signal. But machine learning helped researchers from the University of California in Berkeley and Ohio State University realize that, in fact, two of these types of ambiguity — called degeneracies — can be thought of as specific cases of another, more general degeneracy. The find effectively created a more unified theory of exoplanet microlensing. “This discovery was hiding in plain sight,” wrote co-author Joshua Bloom of UC Berkeley in a blog post.
ESO/L. Calçada/Wikimedia Common

In a paper published May 23 in Nature Astronomy, a team of researchers reported that ML algorithms had helped them discover a more elegant understanding of exoplanet microlensing, unifying multiple interpretations of how the exoplanet’s configuration with its host star might vary. The report came just months after researchers at DeepMind reported in Nature new AI-aided fundamental insights into mathematics.

지난 5월 23일 네이쳐 천문학지에 발표한 논문을 보면 한 연구자 집단은 외계 행성과 그 주성(host star)의 구성이 어떻게 변할지 알아보는 중에 복수의 해석(ultiple interpretations)을 합쳐봄으로써(unifying) 기계 학습 알고리즘이 외계행성 미세 렌즈 현상을 더 세심하게 이해하는데 도움을 주었다고 보고했다. 딥마인드(DeepMind)의 연구자들에게서 몇 달간의 연구로부터 나온 이 보고서는 네이쳐지에 보고되었는데 인공기능 기반의 기초적인 영감을 수학적으로 풀어낼 수 있다고 보고했다.

[인공지능 연구자들이 천문학자들과 협업 하는 중에 새로운 천문학적 수학모델을 만들어 낼 수 있다고 한다. 인공지능 연구자들과 천문학자들의 콜라보!]

Astronomers also hope that in the near future, machine learning will help them identify which planets might be habitable. Using next-generation observatories like the Nancy Grace Roman Telescope and James Webb Space Telescope (JWST), astronomers intend to use ML to detect water, ice, and snow on rocky planets.

천문학자들은 멀지 안아 기계학습이 어떤 행성이 [생명체가] 거주가능(habitable) 할 지 알아낼 수 있을 거라는 기대를 가지고 있다. 낸시 그레이스 로만 망원경이나 제임스 웹 우주 망원경 같은 차세대 천문대를 활용하여 천문학자들은 기계학습 모형을 통해 암석행성에서 물, 얼음 그리고 눈을 감지해 내려고 한다.

Galactic forgeries
은하 위조(은하 모습의 상상도)

While many ML models are trained to distinguish between different types of data, others are intended to produce new data. These generative models are a subset of AI techniques that create artificial data products, such as images, based on some underlying understanding of the data used to train it.

대다수 기계학습 모형들은 주어진 자료를 구분하는 훈련을 하고 있지만 몇몇 다른 모형은 새로운 자료를 생성하는 시도를 하고 있다(intended to). 이 생산형 모형들은 인공자료를 생산하는 인공지능 기술의 한 영역인데, 일테면 학습에 사용한 자료의 이면에 깔린 이해를 바탕으로 새로운 영상을 만드는 것이다.

[기계학습은 분류와 인식이 주된 업무다. 인공지능은 자료를 근거로 그 자료가 생성된 원인과 변화할 모습을 추론하는 능력을 가진다.] 

The series of DALL-E models developed by the research company OpenAI — and the free-to-use imitator it inspired, DALL-E mini — have pushed this concept into the public eye. These models generate an image from any written prompt and have set the internet alight with their uncanny ability to construct images of, for instance, Garfield inserted into episodes of Seinfeld.

오픈AI 사의 연구자들에 의해 개발된 일련의 DALL-E 모형은 (축소판 격인 DALL-E 미니 모형은 무료로 사용할 수 있다) 이렇게 생성된 영상을 대중에 선보여 왔다. 이 모형은 즉석에서 불가사의한 영상 생성능력이 인터넷을 뜨겁게 달궜다(the internet alight). 실제로  드라마에 삽입된 장면을 연출하기도 했다.

You might think that astronomers would be wary of any kind of fake imagery, but in recent years, researchers have turned to generative models in order to create galactic forgeries. A paper published Jan. 28 in Monthly Notices of the Royal Astronomical Society describes using the method to produce incredibly detailed images of fake galaxies, which can be used to test predictions from enormous simulations of the universe. They can also help develop and refine the data processing pipelines for next-generation surveys.

천문학자들은 가짜영상(고의로 만들었든 실제로 찍힌 해석 불가한 관측 영상이든)에 시달린다고 생각할지 모른다. 하지만 최근들어 연구자들은 우주의 상상도(galatic forgeries)를 만들어내기 위해 이 모형에 관심을 가져왔다(have turned to). 월간 왕립 천문학회 회보에 실린 한 논문은 이 모형을 활용해 지어낸 은하의 믿을 수 없을 만큼 세밀한 모습을 실었다. 이 영상은 아득한 우주의 미래모습을 모의실험을 통해 살펴볼 수 있게했다. 이 모형은 차세대 전천관측 자료의 처리에 도움을 줄 수 있고 방향을 구체적으로 제시 할 수 있다.

Some of these algorithms are so good that even professional astronomers can struggle to distinguish between the real and the fake. Take this recent entry into NASA’s Astronomy Picture of the Day webpage, which features dozens of synthetically generated images of objects in the night sky — and just one real image.

이 알고리즘으로 생성된 몇몇의 사진은 실제 천문학자들 조차 진위를 판단하기 어려울 정도였다. 미국항공우주청의 오늘의 우수 천문사진 웹페이지에 최근 밤하늘의 천체라며 십여장의 만들어진 사진들이 게제되었다. 다른 한장의 실제사진과 비교해 보라.

Searching for serendipity
우연한 발견(뜻밖의 발견)

AI is also primed to make discoveries that we cannot predict. There’s a long history of discoveries in astronomy that happened because someone was in the right place, at the right time. Uranus was discovered by chance when William Herschel was scanning the night sky for faint stars, Vesto Slipher measured the speed of spiral arms in what he thought were protoplanetary disks — eventually leading to the discovery of the expanding universe — and Jocelyn Bell Burnell’s famous detection of pulsars happened while she was analyzing measurements of quasars.

인공지능은 인간이 예상치 못한 발견을 해낸는데 중요한 역활을 할 수 있다. 천문학의 역사에서 제때 그장소에서 있었기에 발견한 사례가 있다. 명왕성(Uranus)은 윌리엄 허셜이 어두운 별을 찾아 밤하늘을 훓다가 우연히 발견됐다. 베스토 스리퍼는 행성이 만들어지기 전단계의 원반이라고 여겼으나 실은 은하의 나선팔의 속도를 측정하게 됐었고 결국 우주가 팽창한다는 사실을 발견하기에 이르렀다. 조슬린 벨 버넬의 펄서는 퀘이사 관측 자료를 분석하다 우연히 발견한 유명한 사례다.

[특정 목표를 하지 않고 전체 하늘의 사진을 찍어 공개하는 이유 이기도 하다. NASA의 시민 과학(Citizen Science) 프로그램은 수많은 관측 자료들을 공개하며 시민 참여를 유도한다. 진정한 집단 지성의 예라 하겠다.]

Perhaps soon, an AI could join these ranks of serendipitous discoverers though a field of techniques called anomaly detection. These algorithms are specifically trained to sift through mountains of images, light curves, and spectra, looking for the samples that don’t look like anything we’ve seen before. In the next generation of astronomy, with its petabytes of raw data from observatories like the Rubin and JWST, we can’t possibly imagine what these algorithms might find.

멀지않은 장래에 인공지능은 이 비범한 검출 기술을 통해 우연한 발견자의 목록에 오를 것이다. 이 알고리즘들은 산더미처럼 쌓인 영상과 광도곡선과 분광도를 우리가 이전에 했던것 처럼 선택적으로 골라서(looking for the sample) 그렇게 보진 않는다. 미래의 천문학에서는 류빈 천문대나 제임스 웸 우주망원경에서 얻은 페타 바이트에 이르는 원시자료들을 가지고이 알고리즘들이 무었을 찾아낼지 우리는 상상조차 할 수 없다.

댓글 없음:

댓글 쓰기