[include(틀:다른 뜻1, other1=리듬게임 수록곡, rd1=リカーシブ・ファンクション)] [include(틀:수학기초론)] [include(틀:이론 컴퓨터 과학)] [목차] == 개요 == '''[[재귀함수]]'''([[再]][[歸]][[函]][[數]], recursion)는 정의 단계에서 자신을 재참조하는 [[함수(프로그래밍)|함수]]를 뜻한다. 어떤 사건이 자신을 포함하고 다시 자기 자신을 사용하여 정의될 때 재귀적(recursive)이라고 한다. 일단 무언가를 설명할 때 자기를 포함한 것이라고 이해하면 편하다. == [[재귀함수#설명|설명]] == 하나의 [[함수(프로그래밍)|함수]]에서 자신을 다시 호출하여 작업을 수행하는 방식으로 주어진 문제를 푸는 방법이다. 재귀 호출이나 되부름이라고도 한다. 이 문단의 제목에 걸려 있는 링크를 클릭하는 것은 재귀함수의 동작과 동일하다.[* 링크 오류가 아니다! 구글도 비슷한 예를 들고 있다. [[https://www.google.com/search?q=recursion|recursion]]으로 검색해보자. [[이스터에그|구글의 센스]]를 엿볼 수 있다.] 물론 실제 재귀함수가 쓰이는 곳에서는 매 호출시마다 입력값(파라메터)이 변한다. 저 링크를 클릭하는 건 입력값의 변화가 없는 호출이므로 이론상으로는 무한히 반복할 수 있다. 입력값의 변화가 없거나 입력값의 변화가 특정 패턴을 반복하게 되면 그 재귀함수는 영원히 반복되다가 콜스택 초과로 프로그램이 뻗어 버린다. 꼬리 재귀 최적화가 적용된 알고리즘은 그냥 영원히 돌면서 프로그램이 멈춰 버린다. [[파일:4f218327eb542f0181cc75687cb56096.jpg]] [[파일:우치하 사스케의 무한 recursive.jpg]] ~~이렇게 된다.~~ 이래서 재귀함수는 종료조건이 반드시 있어야 한다. 따라서 재귀함수 설계 시에는 입력값이 종료 조건으로 수렴하는지를 꼭 검증해야 한다. 수학에서는 재귀함수라는 용어를 재귀를 포함함은 물론, 훨씬 더 광범위하게 정의하여 사용한다. 즉, 수학에서 모든 종류의 알고리즘은 재귀함수로 표현되며, 그렇기에 계산가능 함수(computable function)이라는 용어도 사용한다. 반복문(iteration, loop)과 변수를 이용하는 반복적 알고리즘은 재귀함수로 표현할 수 있고 그 역도 성립한다. 이에 영향을 받아 등장한것이 바로 [[LISP]]과 같은 [[프로그래밍 언어#함수형 언어|함수형 언어]]인데, 모든 프로그램(즉, 알고리즘)을 [[함수(프로그래밍)|함수]]로 표현할 수 있다는 것에 착안하여 만들어진 언어들이고, 이 언어들은 재귀를 밥먹듯이 사용한다.[* 보통 ML계열 같은 하이브리드 함수형 언어가 아니면 반복문 자체가 없거나, 있더라도 재귀로 구현되어 있다.] 상술했듯 반복문으로 변수를 바꿔가는 형식의 명령형 계산은 항상 재귀적인 형식으로 똑같이 구현할 수 있으며 그 반대도 마찬가지지만[* 그러나 난이도는 동일하지 않다. [[트리(그래프)|트리 자료구조]]의 전위, 중위, 후위 순회(preorder, inorder, postorder traversal)를 재귀가 아니라 루프로 짜려면 머리 좀 싸매야 할 것이다. [[하노이의 탑]]도 마찬가지.], 현재 산업에서의 언어 패러다임은 대부분 명령형이기 때문에 대개 반복문으로 구현하는게 훨씬 익숙할 것이다. 무엇보다 함수가 호출될 때마다 호출 스택 메모리를 잡아먹는 경우 퍼포먼스 측면에서 반복문이 낫다. 다만 구현체에 꼬리재귀(Tail Recursion) 최적화가 되어있는 경우 꼬리재귀 요청이 스택에 걸리는 대신 이전 실행지점으로의 점프로 작동 하므로 실질적으로 루프문과 유의미한 성능 차이는 없게 된다.[* 물론 구현체에 꼬리재귀 최적화가 없거나 재귀함수가 꼬리재귀할 수 없다면, 루프문이 '''무조건''' 빠르다.] 꼬리재귀 최적화의 경우 함수형 언어 구현체에는 필수적으로 들어가며, 명령형 언어 컴파일러에도 구현되어 있는 경우가 있다. [[C언어|C]], [[C++]]의 경우 [[GCC]], [[LLVM]]/[[Clang]], [[Visual Studio|VC++]] 등의 주요 컴파일러에는 다 구현되어 있기 때문에 안심하고 사용해도 된다. 대부분의 명령형 언어 구현체에서는 간단한 재귀함수를 몇 줄 차이뿐인 반복문으로 쓰는 것이 더 좋은 관계로[* 주요 구현체 중 꼬리재귀 최적화가 없는 경우가 있기 때문이다. 대표적으로 [[Java]]는 꼬리재귀 최적화가 없다. JVM에서 동작하는 다른 언어들 중에는 꼬리재귀 최적화가 구현되어 있는 경우가 많다.] 절차적 언어에서의 재귀를 써야하는 경우는 매우 적다. 더불어 명령형 언어 사용자들이 재귀를 꺼리게 되는 추가적인 이유는 이게 반복을 하는 놈인지 아닌지 알기 어렵다는 점에 있다. 반복문이 대놓고 문장 한가운데서 '이 블록은 반복될 것임'하고 알려주는 것과 다르게 재귀는 별다른 표시없이 혼자 돌게 되므로 코드 내에서 가독성이 떨어지게 된다. 추가적으로, 흐름을 추적하기 어렵다는 이유도 한몫한다. 그리고 반복문의 경우는 For i=1..n처럼 유한히 반복된다는 사실을 명시할 수 있어, 코드만 보면 아무 증명 없이도 [[정지 문제]]를 쉽게 풀 수 있기 때문에 큰 도움이 된다. 이런 종류의 함수를 [[https://en.wikipedia.org/wiki/Primitive_recursive_function|원시 재귀 함수]]라고 부르며 명령형 언어에서 원시 재귀 함수들처럼 반복의 상한을 계산할 수 있으면 재귀와 달리 반복문은 유한성을 명시할 수 있는 이점이 있다. 물론 While True 류의 반복문의 경우에는 적용되지 않는다. 그렇지만 명령형 언어에서도 재귀가 필요할 때가 있는데, 반복문으로 구현했다가는 코드가 심하게 복잡해지거나, 프로그래머가 만들다가 로직이 꼬여 안드로메다로 가는 상황이 발생하는 문제들도 있기 때문. 이 경우 재귀함수로 구현하는 것이 간단하고 훨씬 더 이해하기 쉬운 경우가 있다. 예를 들어 XML이나 JSON을 파싱한다거나 [[퀵 정렬]]을 만든다면 반복문보다 재귀를 쓰는 것이 더 쉽다. 이런 알고리즘을 생 루프문으로 처리하려면 [[스택(자료구조)|스택]]을 따로 구현해야 한다.[* 구현 난이도는 올라갈 수 있으나, 스레드 시작시에 크기가 결정되는 함수 스택을 사용할 때보다 동적 할당을 사용할 수 있는 사용자 정의 스택을 활용할 때 좀더 유연한 구현이 가능하다.] 하지만 소프트웨어 위기와 병렬 컴퓨팅에 대두에 따라, 함수를 최대한 단순하게, 불변적으로 유지하는 것이 새로운 패러다임으로 떠올랐다. 수많은 [[프로그래밍 언어#함수형 언어|함수형 언어]]들이 등장하는 것과 관련이 있다. 그에 따라 재귀함수 등의 함수형 사고를 통해 프로그래밍을 하는 것이 중요한 덕목 중 하나로 떠올랐다. 많은 함수형 언어 구현체에는 루프문이 없을 뿐더러 애초에 필요성도 별로 못 느낀다. 설령 언어에 루프가 있더라도 재귀적으로 구현했다간 코드가 심하게 복잡해지거나 안드로메다로 가는 특수한 상황이 아니면 거의 안쓴다. 그도 그럴 것이 루프문은 돌면서 변수를 변화시키고 루프가 끝나면 변화된 값을 얻어내는 목적이 있다. 그런데 함수형 언어에서는 일반적으로 변수가 없고 '정의'만이 있을 뿐이다. 정의된 값을 바꿀 수 없으니 바뀐 값을 입력으로 사용하는 호출 하나를 더 만들어내는 것이다. 예를 들어 리스트를 역순으로 바꾸는 함수 reverse는 이렇게 동작한다. {{{reverse [1,2,3] = reverse [2,3] + [1] = reverse [3] + [2,1] = reverse [] + [3,2,1] = [3,2,1] }}} 명령형 언어에서는 이렇다. 번호를 매긴 것은 함수 내부에서 변수가 변하는 과정을 추적한 것이다. {{{reverse(s = [1,2,3]) 1. s = [1,2,3], d = [], index = 2 2. s = [1,2,3], d = [3], index = 1 3. s = [1,2,3], d = [3,2], index = 0 4. s = [1,2,3], d = [3,2,1], index = -1 5. return d }}} 변수 index의 상태를 입력 리스트 s의 마지막 원소의 위치인 2로 설정하고, 매 반복마다 index를 하나씩 빼 가면서 해당 인덱스의 원소를 s에서 복사해 d에 넣는다. index가 0 미만이 되면 루프를 종료하고 d를 반환한다. 구현하기에 따라서 s와 d를 스택으로 간주해 pop-push하는 경우도 있지만 메모리가 극단적으로 모자라는 환경이 아닌 한 보통 저렇게 짠다. 극단적인 예시로, [[Haskell]]의 퀵 소트 알고리즘은 단 두 줄만으로 정의된다. {{{qsort [] = [] qsort (p:xs) = qsort [x | x<-xs, x
=p]
}}}
* qsort에 빈 리스트를 대입한 결과는 빈 리스트이다(종료조건)
* qsort에 임의의 리스트를 집어넣을 경우, 리스트 맨 앞의 값을 기준으로 그보다 작은 것, 그리고 뽑은 값, 그리고 뽑은 값보다 크거나 같은 값으로 이루어진 세 개의 리스트를 만들고 그 셋을 붙이는데 첫 번째 리스트와 세 번째 리스트는 qsort 자기 자신으로 다시 처리한다.
저 퀵 소트 알고리즘은 최적화가 되지 않았고(예를 들어 이미 정렬된 배열이나 역순 정렬에 대해 최악의 성능을 보인다) 꼬리재귀 최적화를 적용할 수 없기 때문에 성능은 꽤 나쁘게 나오지만 어쨌든 퀵 소트 알고리즘이 정의하는 그대로를 구현하고 있다. 단 두 줄의 정의문만으로!
상황이 이렇다보니 간단한 연산부터 일관되게 재귀로만 짜는 함수형 언어에 대한 절차적 언어 사용자들의 반응은 [[충격과 공포]] 그 자체. 더구나 함수형 언어 사용자는 변수 및 for-loop보다 재귀호출로 이루어진 것이 버그가 적고 가독성도 좋고(!) 로직이 훨씬 명확하다고 느낀다(!!). 오히려 재귀호출이 너무 당연한 개념이라 명령형 언어에서 재귀호출을 멀리하는 것을 이해하지 못한다.
이렇게 되는 이유 중의 하나는 프로그래밍을 생각하는 방식의 차이 때문이다. 명령형 언어에서 '상태와 그 상태의 변화의 반복'에 집중한다면, 함수형 언어에서는 '어떤 인자에 대응되는 값'이라는 관계, 즉 함수를 생각한다. 명령형 개념에서 재귀호출은 '자기 자신을 호출한다'라는 흐름 제어로 인식하는 반면, 함수형 패러다임에 익숙한 사람은 재귀호출은 마치 [[점화식]]처럼 자기 함수와의 값의 관계를 맺는 것이라고 생각한다.
이런 생각은 상태 변화를 생각하는 것과는 달리 관계 그 자체에 치중하여 코딩할 수 있게 한다. 또한, 이런 생각을 도와주는 게 함수형 언어에서 부수효과가 없다는 건데... 자세한 건 [[프로그래밍 언어#s-4.4.3.1|함수형 언어]] 참조. 아니면 [[LISP]]나 [[OCaml]], [[Haskell]] 등의 함수형 언어를 공부하면서 뇌 개조(...)를 당해보면 된다.
위에는 함수형 언어를 사용할 시에 재귀함수를 반드시 작성해야 하는 것처럼 설명해 놨지만, 함수형 언어를 파고들다 보면 반복적인 처리를 요할 시에 재귀함수를 작성하지 않고, 재귀하는 부분만이 구현된 고차함수를 사용하는 것을 볼 수 있다. 가장 처음 배우는 예시가 fold/reduce 함수들이다. 실제로 fold만 가지고 상당히 재귀적인 호출을 요하는 많은 함수들을 정의할 수 있기 때문에, 함수형 언어에서 직접 재귀함수를 구현하는 경우는 매우 드물다.
더 나아가면, fold는 범주론의 catamorphism에 해당된다는 것을 알 수 있고, 이 외의 anamorphism, hylomorphism, metamorphism 등의 recursion scheme에 대해 알게 되면 모든 재귀적인 함수를 재귀를 사용하지 않고 정의하게 된다. (이정도 되면, 재귀함수는 goto와 비슷하다고 느껴져 코드에 넣는 것을 꺼리게 된다)
문서의 제목은 재귀함수이지만, 연결리스트나 트리와 같은 자료구조는 자신을 통해 정의된다는 점에서 재귀적인 자료구조이다. 명령형 언어중 [[객체 지향 프로그래밍|객체 지향]] 언어일 경우, 재귀적인 자료구조를 통해 호출해서 간단하게 재귀함수를 활용할 수 있어 객체지향 언어의 생산성 향상에 일조한다. 함수형 프로그래밍을 깊게 공부했다면 이러한 자료구조도 Fix/Cofree와 같은 추상화를 통해 재귀없이 정의하게 된다.[* 더 자세히 알고 싶으면, Functional Programming with Bananas, Lenses, Envelopes and Barbed Wire를 읽어볼 것.]
== 예시 ==
{{{#!syntax lisp
(defun fibonacci-recursive (n)
(if (< n 2)
n
(+ (fibonacci-recursive (- n 2)) (fibonacci-recursive (- n 1)))))
}}}
[[LISP]] 으로 작성된 [[피보나치 수열]]을 구하는 재귀함수. fibonacci-recursive 함수 내부에서 에서 자기 자신인 fibonacci-recursive에 n - 1, n - 2 를 인자로 넘겨서 다시 부르는 것을 볼 수 있다.
{{{fib(0, R0, _, R0).
fib(N, R2, R1, RF) :-
N1 is N - 1,
R is R2 + R1,
fib(N1, R1, R, RF).
fib(N, RF) :- fib(N, 0, 1, RF).
}}}
[[Prolog]]로 작성된 Tail Recursion 형 [[피보나치 수열]]을 구하는 재귀함수. 위의 예제와 다르게 함수의 인자를 결과를 저장하는 변수처럼 사용하는 것을 볼 수 있으며, fib(N, R2, R1, RF) 함수의 정의 끝에서 자기 자신을 다시 부르는 것을 볼 수 있다. 많은 선언형, 논리형, 함수형 언어는 이러한 Tail-Recursion 형태의 재귀함수를 최적화하는 기능을 가지고 있다.
=== 자바스크립트 ===
||{{{#!syntax javascript
function factorial(n) {
if (n > 1) {
return n* factorial(n-1);
}
return 1;
}
window.onload = function () {
document.write(factorial(5));
}
}}} ||
|| 재귀함수로 구현된 [[자바스크립트]] 팩토리얼 연산 ||
|| (결과값) 5! = 120 ||
=== C++ ===
||{{{#!syntax cpp
#include