class="layout-aside-right paging-number">
본문 바로가기
제약

[FDA 가이드라인] 다중 결과 변수(Multiple Endpoints) 종류 및 고려 사항

by keurongnong-1 2025. 1. 18.

FDA 가이드라인 "Multiple Endpoints in Clinical Trials Guidance for Industry" 중

> C. Types of Multiple Endpoints 항목에 대하여

임상시험에서 사용되는 다중 결과 변수(multiple endpoints)의 분류와 그 중요성을 설명하며, 이들을 적절히 선택하고 분석하는 방법을 제시합니다. 다중 결과 변수는 약물의 안전성과 유효성을 평가하기 위해 필요한 중요한 측정 기준으로, 임상시험에서 신뢰도 높은 결과를 도출하는 데 필수적입니다.

[FDA 가이드라인] 다중 결과 변수(Multiple Endpoints)의 종류 및 고려 사항

 

1. 다중 결과 변수(Multiple Endpoints) 의 정의와 중요성

다중 결과 변수란 임상시험에서 치료제의 효과를 다각적으로 평가하기 위해 설정된 복수의 측정 기준을 의미합니다. 예를 들어, 암 치료제를 평가할 때 생존율, 질병 진행, 그리고 삶의 질 등이 포함될 수 있습니다.
이러한 결과 변수는 다음의 이유로 중요합니다.

  • 약물의 다양한 효과를 포괄적으로 평가.
  • 특정 치료의 다차원적인 성공 여부 확인.
  • 환자와 의료 전문가에게 실질적인 의미를 제공.

 

2. 다중 결과 변수의 유형 (Types of Multiple Endpoints)

다중 결과 변수는 분석 목적과 구조에 따라 여러 유형으로 나뉘며, 이를 이해하고 적절히 활용하는 것이 임상시험 설계에서 중요합니다.

(1) Primary, Secondary, and Exploratory Endpoints

  • Primary Endpoint (주요 결과 변수):
    임상시험의 주요 목표를 평가하는 핵심 변수입니다.
    • 약물의 효과를 입증하는 데 가장 중요한 역할을 합니다.
    • FDA 승인을 받기 위해 필요한 근거 자료로 사용됩니다.
    • 예: 항암제의 경우 전체 생존율(OS) 또는 무진행 생존기간(PFS).
  • Secondary Endpoint (2차 결과 변수):
    주요 결과 변수를 보완하거나 추가적인 치료 효과를 평가하기 위한 변수입니다.
    • 예: 삶의 질, 부작용 발생률 등.
  • Exploratory Endpoint (탐색적 결과 변수):
    초기 연구 단계에서 약물의 잠재적 효과를 탐색하기 위해 설정됩니다.
    • 예: 특정 바이오마커의 변화.

(2) Composite Endpoints (복합 결과 변수)

복합 결과 변수는 복수의 개별적인 임상 사건 또는 측정 결과하나의 단일 결과 변수로 결합하여 사용하는 방법입니다. 이는 임상시험에서 주요 평가 지표로 활용되며, 특히 각 개별 사건의 발생률이 낮은 경우 임상시험의 통계적 검정력을 높이는 데 유리합니다.

 

1. 특징

  • 다양한 사건의 통합:
    복합 결과 변수는 개별적으로 중요한 사건들을 하나의 단일 변수로 결합하여, 해당 사건이 발생하면 복합 결과로 간주됩니다.
  • 높은 통계적 검정력(Power):
    각 개별 사건의 발생률이 낮아도 여러 사건을 합하면 전체 발생률이 높아져 더 적은 표본 크기로도 유의미한 결과 (높은 검정력)를 도출할 수 있습니다.
  • 전체 효과를 평가:
    단일 결과 변수로는 포착하기 어려운 치료의 종합적인 영향을 평가할 수 있습니다.

2. 예시

  • 심혈관계 약물 임상시험:
    복합 결과 변수로 심혈관 사망, 심근경색, 뇌졸중을 포함.
    • 시험 성공 여부는 환자에게 이 중 하나라도 발생하지 않는 것을 기준으로 평가.
  • 암 치료제:
    질병 진행(progression)과 사망을 포함하여 무진행 생존기간(PFS)을 복합 변수로 설정.

3. 장점

  • 효율성 증가:
    시험 기간 단축 및 소규모 표본 크기로도 효과를 검증 가능.
  • 종합적 치료 효과 평가:
    약물이 다양한 사건에 미치는 영향을 종합적으로 평가.
  • 다중성 문제(multiplicity problem; 제1종 오류가 커지는 문제) 가 발생하지 않음. 

4. 단점과 한계

  • 구성 요소의 중요도 차이:
    모든 구성 요소가 동등한 임상적 중요성을 가지지 않을 수 있습니다.
    예: 심혈관 사망이 뇌졸중보다 임상적으로 더 중요할 수 있음.
  • 결과 해석의 복잡성:
    복합 결과 변수에서 특정 구성 요소가 과도하게 결과에 기여하면 왜곡된 결론이 나올 수 있습니다.
  • 구성 요소 간 이질성:
    사건별로 약물이 미치는 영향이 다를 경우 해석이 어려워질 수 있습니다.

5. 고려사항

  • 복합 결과 변수의 구성 요소는 환자에게 임상적으로 의미 있는 사건으로 설정해야 합니다.
  • 각 사건의 발생률과 상대적 중요도를 명확히 설명해야 합니다.
  • 구성 요소 간의 상관관계 및 일관성을 분석하여 데이터 왜곡을 최소화해야 합니다.

(3) Hierarchical Endpoints (계층적 결과 변수)

결과 변수의 중요도에 따라 계층적으로 평가합니다.

  • 상위 결과 변수가 성공적일 경우에만 하위 결과 변수를 평가.
  • 장점:
    • 여러 결과 변수를 사용하되 통계적 오류를 줄임.
  • 예:
    1순위: 생존율, 2순위: 삶의 질 개선.

(4) Co-primary Endpoints (공동 주요 결과 변수)

공동 주요 결과 변수(co-primary endpoints)는 하나의 임상시험에서 복수의 주요 결과 변수 (Primary Endpoint) 를 설정하여, 이들 모두를 만족해야 시험 성공으로 간주되는 방식입니다. 이는 약물의 다각적인 효과를 평가하는 데 활용됩니다.

 

1. 특징

  • 복수의 주요 목표:
    약물이 여러 가지 중요한 임상적 효과를 동시에 달성해야 (즉 모든 주요 결과 변수의 통계적 유의성을 보여주어야) 시험 성공으로 인정됩니다.
  • 엄격한 기준:
    모든 공동 주요 결과 변수에서 유의미한 결과를 보여야 하므로, 시험 성공 가능성이 낮아질 수 있습니다.

2. 예시

  • 알츠하이머 치료제:
    인지능력 향상과 일상생활 기능 개선이라는 두 가지 주요 결과 변수를 설정.
  • 당뇨병 치료제:
    혈당 조절(HbA1c 감소)과 체중 감소를 모두 만족해야 시험 성공으로 간주.

3. 장점

  • 다차원적인 효과 평가:
    약물이 여러 측면에서 환자에게 유의미한 영향을 미치는지 확인 가능.
  • 종합적 데이터 제공:
    단일 결과 변수로는 포착하기 어려운 복합적인 치료 효과를 확인.
  • 다중성 문제(multiplicity problem; 제1종 오류가 커지는 문제) 가 발생하지 않음. 

4. 단점과 한계

  • 임상시험 성공률 감소:
    모든 결과 변수에서 유의미한 결과를 도출해야 하므로, 시험 성공 가능성이 낮아질 수 있음.
  • 통계적 검정력(Power) 감소:
    공동 주요 결과 변수가 많아질수록 통계적 오류 조정이 필요하여 검정력이 낮아질 수 있음. 예를 들어, 각 두 개의 결과 변수(Endpoint)로 이루어진 Co-Primary Endpoint로 설정하였고 검정력 80%를 보장하는 시험의 표본 수로 임상시험을 진행한다면, 검정력이 64% (0.8*0.8)로 감소될 수 있다 (두 결과 변수가 독립적이라 가정하였을 경우). 
  • 해석의 복잡성:
    일부 결과 변수에서 유의미하지 않은 결과가 나올 경우, 전체 결과를 어떻게 해석할지에 대한 명확한 가이드라인이 필요함.

5. 고려사항

  • 공동 주요 결과 변수의 개수는 최소화하여 통계적 검정력을 유지하는 것이 중요합니다.
  • 결과 변수 간 상관성을 분석하여 데이터 해석의 신뢰성을 높여야 합니다.
  • 모든 결과 변수가 환자와 치료에 실질적으로 중요한지 확인해야 합니다.

(5) Other Multi-Component  Endpoints (기타 다중 구성 요소 결과 변수)

각 구성 요소의 개별적인 분석 결과를 동시에 고려하거나, 특정 기준에 따라 여러 결과 변수의 정보를 종합적으로 평가하는 방식입니다. Composite Endpoints와 달리, 다중 구성 요소 결과 변수는 개별 사건의 독립적인 중요성을 유지하면서 전체적인 치료 효과를 평가합니다.

 

1. 특징 

  • 독립적 분석
    • 구성 요소 각각이 독립적인 결과 변수로 간주되어 개별적으로 분석됩니다.

2. 예시

  • 암 치료제 임상시험에서 다음 요소들을 각각 독립적으로 평가:
    • 종양 크기의 감소
    • 환자의 생존 기간 연장
    • 삶의 질 향상

3. 장점

  • 특정 구성 요소가 만족되지 않아도 다른 구성 요소를 통해 약물의 효과를 입증할 수 있습니다.

4. 단점 및 고려사항

  • 각 구성 요소에 대해 별도의 분석 방법과 유의성을 설정해야 합니다.
  • 통계적 다중성 문제가 발생할 가능성이 높아 적절한 1종 오류 제어 방법(Bonferroni 교정 등)이 필요합니다.

 

(6) Surrogate Endpoints (대리 결과 변수)

질병의 임상적 결과를 대체할 수 있는 간접적인 지표로 사용됩니다.

  • 장점:
    시험 기간 단축 가능.
  • 단점:
    대리 변수가 실제 임상적 결과와 반드시 일치하지 않을 수 있음.
  • 예:
    혈압 변화(심혈관계 질환의 대리 지표), 혈당 수준(당뇨병 약물).

 

3. 다중 결과 변수 사용 시 주요 고려사항

(1) 제 1종 오류 조정

다중 결과 변수를 사용하면 제1종 오류 위험이 증가합니다 (어떤 다중 결과 변수를 사용하느냐에 따라 달리짐). 이를 해결하기 위해 다양한 통계적 방법이 활용됩니다.

  • Bonferroni 조정: 결과 변수의 개수에 따라 α(유의수준)를 나누어 사용하는 방법.
  • Hochberg 또는 Holm 방법: 보다 유연한 다중 검정 조정 방법.
  • Prospective Alpha Allocation Scheme (PAAS): 사전에 α(유의수준)를 각 가설 또는 결과 변수에 배분하는 통계적 계획
  • Fixed-Sequence 방법: 가설 간 우선순위와 검정 순서를 명확히 정의하여 검정하는 방법으로 선순위에 있는 가설이 기각되지 않으면 다음 순서의 가설은 검정하지 않는 방법. α(유의수준)의 배분 없이 검정할 수 있다는 장점은 있지만 가설을 기각하지 못할 경우 다음 단계의 가설은 검정하지 못한다는 위험을 감수해야 함. 
  • Gatekeeping Testing 전략: 가설들이 여러 그룹으로 나뉘어 있으며, 상위 그룹의 모든 가설이 검정 조건을 충족해야만 하위 그룹의 검정을 시작할 수 있는 방법 (그룹 내에서 가설 검정 순서는 유연)
  • Fallback 방법: Fixed-Sequence 방법의 변형된 방법으로, 상위 우선순위 가설이 기각된 경우, 해당 가설에 할당된 α(유의수준)의 일부 또는 전부를 하위 우선순위 가설로 재분배하는 방법. 상위 가설이 기각되지 않아도 다른 가설이 검정될 수 있도록 유연성 있는 방법. 
특징 Gatekeeping Testing Strategies Fixed Sequence Method Fallback Method
가설 그룹화 가설이 여러 그룹으로 나뉘고 그룹별 검정 가능 여부가 결정됨. 모든 가설이 단일 순서로 고정됨. 가설 그룹화가 가능하며, 사전에 정의된 조건에 따라 유연하게 진행.
유연성 그룹 내 검정 방식이 유연함(예: Bonferroni, Holm 등). 순서가 고정되어 있으며 사전 정의된 경로만 따름. 상위 가설 실패 시에도 하위 가설을 검정할 기회가 제공될 수 있음.
검정 순서 상위 그룹의 모든 가설 검정이 끝난 후 하위 그룹 검정 진행. 고정된 순서에 따라 단계별로 검정. 조건부로 검정이 진행되며, 사전 계획에 따라 α(유의수준)를 재분배.
검정 실패 영향 상위 그룹 일부 실패 시, 하위 그룹 검정 불가. 하나의 가설이 실패하면 이후 가설은 검정되지 않음 상위 가설 실패 후에도 하위 가설에 α(유의수준)이 재분배될 수 있음.
다중성 문제 통제 그룹 간 상호 의존성을 통제. 고정된 순서로 다중성 통제. α(유의수준)를 유연하게 재분배하여 다중성 문제를 해결.
적용 범위 주요 및 보조 결과 변수 간 그룹화가 중요한 경우. 단일 경로 검정으로 단순한 구조를 가진 경우. 복잡한 다중 가설 검정에서 유연성과 검정력을 모두 요구하는 경우.
복잡성 상대적으로 복잡(다중 그룹과 방법론). 단순한 검정 구조. 중간 수준의 복잡성으로, 유연성과 통제가 모두 가능.

 

(2) 상관관계 및 독립성

  • 결과 변수 간 상관성이 높은 경우, 데이터 해석 시 주의가 필요합니다.
  • 독립적인 결과 변수를 설정하여 신뢰도 높은 데이터를 확보.

(3) 환자 중심 결과 변수 설정

환자에게 실질적으로 중요한 변수를 포함해야 합니다.

  • 예: 통증 완화, 기능 개선 등.

 

4. 결론

C. Types of Multiple Endpoints는 임상시험 설계에서 신약 및 제네릭의 유효성과 안전성을 포괄적으로 평가할 수 있는 다양한 결과 변수의 유형을 다룹니다. 각 결과 변수는 약물 효과를 다각도로 평가하기 위해 상호보완적인 역할을 하며, 시험의 목적과 대상에 따라 적절히 선택되어야 합니다.

다중 결과 변수의 사용은 약물 개발의 신뢰성과 효율성을 높이지만, 이를 제대로 관리하지 않으면 통계적 오류가 발생하거나 데이터 해석이 왜곡될 위험이 있습니다. 따라서 FDA 가이드라인에서 제시하는 원칙과 통계적 기법을 준수하여 설계된 다중 결과 변수는 신약 및 제네릭의 안전성과 유효성을 입증하는 데 핵심적인 역할을 합니다.