Рандомизация определение цели методы ошибки определение

Рандомизация

Рандомизация
– это процесс случайного распределения
участников эксперимента
по группам или порядка предъявления им
экспериментальных условий.

Для
каждой из экспериментальных
схем

существуют свои методы рандомизации.

Так
для межгрупповой
схемы
,
основной недостаток которой состоит в
том, что существует постоянная опасность
смешения из-за разницы испытуемых в
группах, используются две техники
распределения испытуемых по группам,
которые помогают избежать этого
нежелательного эффекта:

1)
Первая техника

распределение случайным образом
(рандомизация)
При этом методе характеристики испытуемых
игнорируются и распределение по группам
является случайным и непредвзятым. Это
значит, что любой испытуемый имеет
равные шансы попасть в любую группу.
Способы формирования групп:

  • простейший
    генератор случайных чисел

  • таблица
    случайных чисел

Следует,
однако, учитывать, что рандомизация не
гарантирует равенство групп по важным
для исследователя показателям.

2)
Вторая стратегия
распределение по условиям

(стратегия
попарного отбора
)
Эта техника употребляется реже, чем
первая. Экспериментальная и контрольные
группы составляются из индивидов,
эквивалентных по значимым для
экспериментатора параметрам. Обычно
распределение производится по переменной,
которая вероятнее всего может вызвать
смешение. Такое распределение имеет
ряд проблем:

  • невозможность
    соотнести все характеристики с условиями
    эксперимента,

  • экспериментатор
    может не знать, какие характеристики
    следует принимать во внимание,

  • даже
    если группы уже сформированы, все равно
    экспериментатор может пропустить
    какую-либо характеристику, потенциально
    связанную с независимой переменной,

  • распределение
    по одной переменной может нарушить
    распределение по другим переменным,

  • потеря
    испытуемых, т.е. один или несколько
    испытуемых не участвуют в эксперименте
    до конца, или их поведение меняется
    радикально по причинам, далеким от
    независимой переменной. Испытуемый
    может заболеть, отказаться от дальнейшего
    участия или же выполнять тесты с таким
    количеством ошибок, что результаты
    становятся неинтерпретируемыми. В
    длительном эксперименте испытуемые
    могут взрослеть и их характеристики
    будут изменяться. Несмотря на тщательное
    распределение испытуемых по группам,
    потеря даже одного испытуемого может
    сделать группы неравными по своим
    характеристикам.

В
интраиндивидуальной экспериментальной
схеме основное допущение ее использования
объект
остается идентичен самому себе с течением
времени —

может нарушаться из-за ряда причин. При
этом систематическая разница в наблюдениях
будет вызвана не действием независимой
переменной, а другими факторами. Например,
изменения в участниках может произойти
из-за:

  1. Влияния
    времени
    ,
    т.е.
    исследуемый эффект наступил с течением
    времени не из-за действия независимой
    переменной, а сам собой (привыкание,
    обучение,
    усталость)
    или в результате действия третьей
    переменной (что-либо случилось с
    участниками во время эксперимента или
    они стали свидетелями некоторого
    события, повлиявшего на них существенным
    образом). Таким образом, наблюдаемый
    эффект вызывается фазами исследований,
    а не действием независимой переменной.

  2. Влияние
    порядка
    предъявления
    условий

    влияние условий одного испытания на
    последующие. Для того чтобы избежать
    этой опасности, существуют две методики:

  • Случайное
    распределение (рандомизация)
    условий
    — порядок предъявления уровней
    независимой переменной определяется
    случайным образом для каждого
    испытуемого. Однако данная методика
    не гарантирует устранения эффекта
    влияния.

  • Уравнивание
    (контрбалансировка)
    — каждое условие встречается в любой
    период эксперимента. Таким образом,
    каждое условие имеет одинаковые шансы
    получить влияние смешенной переменной.
    Полное
    уравнивание

    требует, чтобы все возможные порядки
    испытаний были использованы. Однако,
    чем больше число условий, тем больше
    число их порядков. Если число условий
    п,
    то число порядков п!
    Поэтому на определенном этапе полное
    уравнивание становится невозможным.
    При невозможности полного уравнивания,
    применяют методику частичного
    уравнивания

    (латинский
    квадрат
    )

В
латинском квадрате каждое условие
(уровень независимой переменной)
встречается в каждой части эксперимента.
Например, условие А
встречается в 1-й, 2-й, 3-й и т.д. части;
условие В
— также, условие С
— также и т.д. Для четырех условий схема
латинского квадрата приведена на Рис.
1.

№ испытуемого

порядок
следования условий

1

А

В

С

Д

2

В

С

Д

А

3

С

Д

А

В

4

Д

А

В

С

Рисунок
1. Латинский квадрат для четырех условий.

В
латинском квадрате число испытаний
равно числу условий (n).
Поэтому количество
испытуемых должно равняться, по крайней
мере, количеству испытаний.

Для
статистических расчетов лучше использовать
большее количество испытуемых — их
число должно быть кратно п.
В этом случае мы можем повторить
исследование несколько раз. Каждый раз
мы можем либо:

  1. использовать
    один и тот же латинский квадрат для
    всех случаев. Однако может возникнуть
    следующая проблема: выбор некоторой
    определенной схемы латинского квадрата
    вместо полного уравнивания приведет
    к серьезным погрешностям, если латинский
    квадрат оказался по каким-то причинам
    неудачным. Поэтому после проведения
    эксперимента стоит провести статистический
    тест на единственность квадрата. Если
    тест статистически значимый, считается,
    что частичное уравнивание не дало
    нужного эффекта и результаты исследования
    под вопросом. Если тест не значимый, то
    у нас нет формального основания
    сомневаться в полученных данных.

  2. использовать
    другой латинский квадрат на каждые
    следующие п
    испытуемых. Такая процедура хороша
    тем, что ближе к полному уравниванию,
    однако для нее не существует статистического
    теста на единственность квадрата и у
    нас нет никакого формального теста для
    проверки степени уравнивания условий.

  3. использовать
    так называемый, сбалансированный
    латинский квадрат,

    в
    котором каждое условие идет до и после
    каждого другого условия (Рис. 2)

№ испытуемого

порядок
следования условий

1

А

В

С

Д

2

В

Д

А

С

3

С

А

Д

В

4

Д

С

В

А

Рисунок
2. Сбалансированный латинский квадрат

Многие
исследователи считают, что лучше
использовать именно этот тип латинского
квадрата, хотя нет никакого статистического
теста, подтверждающего такую точку
зрения. Кроме того, сбалансированный
латинский квадрат имеет дополнительный
недостаток — он не подходит, когда число
условий нечетное.

Следует
отметить, что полное уравнивание — самая
надежная техника при интраиндивидуальной
схеме эксперимента. Если количество
условий мало, предпочтительно использовать
именно эту процедуру; если число условий
велико, следует использовать латинские
квадраты, дающие частичное уравнивание.

Рандомизация
участников и условий является обязательным
требованием применимости критериев на
статистическую значимость разницы
результатов.

Метод
стратификации относится к методам
отбора выборки,имеющим следующие
особенности:

генеральная
совокупность состоит из элементов

генеральная
совокупность разделена на групп,
называемых стратами или слоями

каждый
элемент совокупности принадлежит одной
и только одной страте

известно
количество наблюдений внутри каждой
страты

исследователь
получает вероятность выборки из каждой
страты

Стратификация
– довольно распространенный приём. Это
обусловлено многими причинами; перечислим
основные из них.

Если
желательно получить с определенной
точностью данные о некоторых подразделениях
совокупности, то каждое такое подразделение
рекомендуется рассматривать на правах
самостоятельной «совокупности»

Применение
расслоения может быть продиктовано
организационными соображениями,
например, агентство, проводящее
обследование, может иметь районные
отделения, каждое из которых обеспечивает
проведение обследования какой-либо
части совокупности

Проблемы,
связанные с отбором в разных частях
совокупности, могут сильно разниться.
При выборочных обследованиях населения
людей, находящихся в таких заведениях,
как гостиницы, больницы, тюрьмы, часто
выделяют в отдельный слой в отличие от
людей, живущих в обычных домах, поскольку
к отбору в этих двух случаях требуется
разный подход. При обследовании,
предпринятом с целью изучения деловой
активности, мы можем составить список
крупных фирм, выделив в их отдельный
слой. Для более мелких фирм можно
применить один из видов территориального
отбора.

Расслоение
может дать выигрыш в точности при
оценивании характеристик всей
совокупности. Иногда неоднородную
совокупность удается подразделить на
подсовокупности, каждая из которых
внутренне однородна. Это и подразумевается
под названием слой по аналогии с
разделением на слои в геологии. Если
каждый слой однороден в том смысле, что
результаты измерений в нём очень мало
изменяются, то можно получить точную
оценку среднего для любого слоя по
небольшой выборке в этом слое. Затем
эти оценки можно объединить в одну
точную оценку для всей совокупности.

Пропорциональный
выбор

Размер
каждой страты в выбранной выборке
получается пропорционально размеру
всей страты. Это называется пропорциональным
размещением, т.е. доля отбора одинакова
для каждой страты.

Плюсы:

Пропорциональный
выбор в стратификации обеспечивает
больший или равный уровень точности,
чем при использовании простого случайного
выбора.

Точность
увеличивается с улучшением однородности
внутри каждой страты

Улучшение
точности относится ко всем параметрам
исследования

При
непропорциональном выборе доля отбора
может сильно отличаться в каждой страте.

  1. Источники
    информации.

    1. Основная
      литература:

п/п

Автор(ы)

Название
источника

(учебника,
учебного пособия, монографии, и тому
подобное)

Город

изд-во

Год
издания,
том, вып.

Кол-во
стор.

за
ред. проф. Москаленка В.Ф.

«Соціальна
медицина і організація охорони
здоров`я»

Київ

Книга
плюс

2010

324

за
ред. проф. Москаленка В.Ф.

Біостатистика

Київ

Книга
плюс

2009

184

3.1

Під
ред.

Вороненка
ю.В.

Моськаленка
в.Ф.

Соціальна
медицина та організація
охорони
здоров’я

Тернопіль

2000

680

4.

За
ред.
професора
Ю.В. Воронячого

Посібник
із соціальної
медицини
та організації
охорони
здоров’я.

Київ

“Здоров’я”

2002

5.

Власов
В.В.

Введение
в доказательную медицину.

М.Медиа
Сфера

2001

392

6.

Елисеева
И.И.,

Юзбашев
М.М.

Общая
теория статистики

Учебник

4-е
изд., перераб. и доп

М.:
Финансы и Статистика

2000

480

    1. Дополнительная
      литература:

п/п

Автор(ы)

Название
источника

(учебника,
учебного пособия, монографии, и тому
подобное)

Город

изд-во

Год
изд-ва,
том, вып.

Кол-во
стор.

Укрмедкніга

Програмні
тестові
питання
з соціально
медицини
та організації
охорони
здоров’я

Тернопіль

2000

Зайцев
В.М.,

Лифляндский
В.Г., Маринкин В.И.

Прикладная
медицинская статистика

ООО

«Издательство
ФОЛИАНТ»

2003

432

Реброва
О.Ю.

Статистический
анализ медицинских данных. Применение
пакета прикладных программ STATISTICA

М.:
Медиа

Сфера

2002

312

Freedman
L.

Bayesian
statistical methods [Editorial].

BMJ

1996

70

Goodman
S.N.

Toward
evidence-based medical statistics. The Bayes factor.

Ann
Intern Med

1999

130

Hayden
G.

Biostatistical
trends in pediatrics: implications for the future.

Pediatrics

1983

72-84

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Flowchart of four phases (enrollment, allocation, intervention, follow-up, and data analysis) of a parallel randomized trial of two groups (in a controlled trial, one of the interventions serves as the control), modified from the CONSORT (Consolidated Standards of Reporting Trials) 2010 Statement[1]

A randomized controlled trial (or randomized control trial;[2] RCT) is a form of scientific experiment used to control factors not under direct experimental control. Examples of RCTs are clinical trials that compare the effects of drugs, surgical techniques, medical devices, diagnostic procedures or other medical treatments.

Participants who enroll in RCTs differ from one another in known and unknown ways that can influence study outcomes, and yet cannot be directly controlled. By randomly allocating participants among compared treatments, an RCT enables statistical control over these influences. Provided it is designed well, conducted properly, and enrolls enough participants, an RCT may achieve sufficient control over these confounding factors to deliver a useful comparison of the treatments studied.

Definition and examples[edit]

An RCT in clinical research typically compares a proposed new treatment against an existing standard of care; these are then termed the ‘experimental’ and ‘control’ treatments, respectively. When no such generally accepted treatment is available, a placebo may be used in the control group so that participants are blinded to their treatment allocations. This blinding principle is ideally also extended as much as possible to other parties including researchers, technicians, data analysts, and evaluators. Effective blinding experimentally isolates the physiological effects of treatments from various psychological sources of bias.

The randomness in the assignment of participants to treatments reduces selection bias and allocation bias, balancing both known and unknown prognostic factors, in the assignment of treatments.[3] Blinding reduces other forms of experimenter and subject biases.

A well-blinded RCT is considered the gold standard for clinical trials. Blinded RCTs are commonly used to test the efficacy of medical interventions and may additionally provide information about adverse effects, such as drug reactions. A randomized controlled trial can provide compelling evidence that the study treatment causes an effect on human health.[4]

The terms «RCT» and «randomized trial» are sometimes used synonymously, but the latter term omits mention of controls and can therefore describe studies that compare multiple treatment groups with each other in the absence of a control group.[5] Similarly, the initialism is sometimes expanded as «randomized clinical trial» or «randomized comparative trial«, leading to ambiguity in the scientific literature.[6][7] Not all RCTs are randomized controlled trials (and some of them could never be, as in cases where controls would be impractical or unethical to use). The term randomized controlled clinical trial is an alternative term used in clinical research;[8] however, RCTs are also employed in other research areas, including many of the social sciences.

History[edit]

The first reported clinical trial was conducted by James Lind in 1747 to identify treatment for scurvy.[9] The first blind experiment was conducted by the French Royal Commission on Animal Magnetism in 1784 to investigate the claims of mesmerism. An early essay advocating the blinding of researchers came from Claude Bernard in the latter half of the 19th century.[vague] Bernard recommended that the observer of an experiment should not have knowledge of the hypothesis being tested. This suggestion contrasted starkly with the prevalent Enlightenment-era attitude that scientific observation can only be objectively valid when undertaken by a well-educated, informed scientist.[10] The first study recorded to have a blinded researcher was conducted in 1907 by W. H. R. Rivers and H. N. Webber to investigate the effects of caffeine.[11]

Randomized experiments first appeared in psychology, where they were introduced by Charles Sanders Peirce and Joseph Jastrow in the 1880s,[12] and in education.[13][14][15]

In the early 20th century, randomized experiments appeared in agriculture, due to Jerzy Neyman[16] and Ronald A. Fisher. Fisher’s experimental research and his writings popularized randomized experiments.[17]

The first published Randomized Controlled Trial in medicine appeared in the 1948 paper entitled «Streptomycin treatment of pulmonary tuberculosis», which described a Medical Research Council investigation.[18][19][20] One of the authors of that paper was Austin Bradford Hill, who is credited as having conceived the modern RCT.[21]

Trial design was further influenced by the large-scale ISIS trials on heart attack treatments that were conducted in the 1980s.[22]

By the late 20th century, RCTs were recognized as the standard method for «rational therapeutics» in medicine.[23] As of 2004, more than 150,000 RCTs were in the Cochrane Library.[21] To improve the reporting of RCTs in the medical literature, an international group of scientists and editors published Consolidated Standards of Reporting Trials (CONSORT) Statements in 1996, 2001 and 2010, and these have become widely accepted.[1][3] Randomization is the process of assigning trial subjects to treatment or control groups using an element of chance to determine the assignments in order to reduce the bias.

Ethics[edit]

Although the principle of clinical equipoise («genuine uncertainty within the expert medical community… about the preferred treatment») common to clinical trials[24] has been applied to RCTs, the ethics of RCTs have special considerations. For one, it has been argued that equipoise itself is insufficient to justify RCTs.[25] For another, «collective equipoise» can conflict with a lack of personal equipoise (e.g., a personal belief that an intervention is effective).[26] Finally, Zelen’s design, which has been used for some RCTs, randomizes subjects before they provide informed consent, which may be ethical for RCTs of screening and selected therapies, but is likely unethical «for most therapeutic trials.»[27][28]

Although subjects almost always provide informed consent for their participation in an RCT, studies since 1982 have documented that RCT subjects may believe that they are certain to receive treatment that is best for them personally; that is, they do not understand the difference between research and treatment.[29][30] Further research is necessary to determine the prevalence of and ways to address this «therapeutic misconception».[30]

The RCT method variations may also create cultural effects that have not been well understood.[31] For example, patients with terminal illness may join trials in the hope of being cured, even when treatments are unlikely to be successful.

Trial registration[edit]

In 2004, the International Committee of Medical Journal Editors (ICMJE) announced that all trials starting enrolment after July 1, 2005, must be registered prior to consideration for publication in one of the 12 member journals of the committee.[32] However, trial registration may still occur late or not at all.[33][34]
Medical journals have been slow in adapting policies requiring mandatory clinical trial registration as a prerequisite for publication.[35]

Classifications[edit]

By study design[edit]

One way to classify RCTs is by study design. From most to least common in the healthcare literature, the major categories of RCT study designs are:[36]

  • Parallel-group – each participant is randomly assigned to a group, and all the participants in the group receive (or do not receive) an intervention.[37][38]
  • Crossover – over time, each participant receives (or does not receive) an intervention in a random sequence.[39][40]
  • Cluster – pre-existing groups of participants (e.g., villages, schools) are randomly selected to receive (or not receive) an intervention.[41][42]
  • Factorial – each participant is randomly assigned to a group that receives a particular combination of interventions or non-interventions (e.g., group 1 receives vitamin X and vitamin Y, group 2 receives vitamin X and placebo Y, group 3 receives placebo X and vitamin Y, and group 4 receives placebo X and placebo Y).

An analysis of the 616 RCTs indexed in PubMed during December 2006 found that 78% were parallel-group trials, 16% were crossover, 2% were split-body, 2% were cluster, and 2% were factorial.[36]

By outcome of interest (efficacy vs. effectiveness)[edit]

RCTs can be classified as «explanatory» or «pragmatic.»[43] Explanatory RCTs test efficacy in a research setting with highly selected participants and under highly controlled conditions.[43] In contrast, pragmatic RCTs (pRCTs) test effectiveness in everyday practice with relatively unselected participants and under flexible conditions; in this way, pragmatic RCTs can «inform decisions about practice.»[43]

By hypothesis (superiority vs. noninferiority vs. equivalence)[edit]

Another classification of RCTs categorizes them as «superiority trials», «noninferiority trials», and «equivalence trials», which differ in methodology and reporting.[44] Most RCTs are superiority trials, in which one intervention is hypothesized to be superior to another in a statistically significant way.[44] Some RCTs are noninferiority trials «to determine whether a new treatment is no worse than a reference treatment.»[44] Other RCTs are equivalence trials in which the hypothesis is that two interventions are indistinguishable from each other.[44]

Randomization[edit]

The advantages of proper randomization in RCTs include:[45]

  • «It eliminates bias in treatment assignment,» specifically selection bias and confounding.
  • «It facilitates blinding (masking) of the identity of treatments from investigators, participants, and assessors.»
  • «It permits the use of probability theory to express the likelihood that any difference in outcome between treatment groups merely indicates chance.»

There are two processes involved in randomizing patients to different interventions. First is choosing a randomization procedure to generate an unpredictable sequence of allocations; this may be a simple random assignment of patients to any of the groups at equal probabilities, may be «restricted», or may be «adaptive.» A second and more practical issue is allocation concealment, which refers to the stringent precautions taken to ensure that the group assignment of patients are not revealed prior to definitively allocating them to their respective groups. Non-random «systematic» methods of group assignment, such as alternating subjects between one group and the other, can cause «limitless contamination possibilities» and can cause a breach of allocation concealment.[46]

However empirical evidence that adequate randomization changes outcomes relative to inadequate randomization has been difficult to detect.[47]

Procedures[edit]

The treatment allocation is the desired proportion of patients in each treatment arm.

An ideal randomization procedure would achieve the following goals:[48]

  • Maximize statistical power, especially in subgroup analyses. Generally, equal group sizes maximize statistical power, however, unequal groups sizes may be more powerful for some analyses (e.g., multiple comparisons of placebo versus several doses using Dunnett’s procedure[49] ), and are sometimes desired for non-analytic reasons (e.g., patients may be more motivated to enroll if there is a higher chance of getting the test treatment, or regulatory agencies may require a minimum number of patients exposed to treatment).[50]
  • Minimize selection bias. This may occur if investigators can consciously or unconsciously preferentially enroll patients between treatment arms. A good randomization procedure will be unpredictable so that investigators cannot guess the next subject’s group assignment based on prior treatment assignments. The risk of selection bias is highest when previous treatment assignments are known (as in unblinded studies) or can be guessed (perhaps if a drug has distinctive side effects).
  • Minimize allocation bias (or confounding). This may occur when covariates that affect the outcome are not equally distributed between treatment groups, and the treatment effect is confounded with the effect of the covariates (i.e., an «accidental bias»[45][51]). If the randomization procedure causes an imbalance in covariates related to the outcome across groups, estimates of effect may be biased if not adjusted for the covariates (which may be unmeasured and therefore impossible to adjust for).

However, no single randomization procedure meets those goals in every circumstance, so researchers must select a procedure for a given study based on its advantages and disadvantages.

Simple[edit]

This is a commonly used and intuitive procedure, similar to «repeated fair coin-tossing.»[45] Also known as «complete» or «unrestricted» randomization, it is robust against both selection and accidental biases. However, its main drawback is the possibility of imbalanced group sizes in small RCTs. It is therefore recommended only for RCTs with over 200 subjects.[52]

Restricted[edit]

To balance group sizes in smaller RCTs, some form of «restricted» randomization is recommended.[52] The major types of restricted randomization used in RCTs are:

  • Permuted-block randomization or blocked randomization: a «block size» and «allocation ratio» (number of subjects in one group versus the other group) are specified, and subjects are allocated randomly within each block.[46] For example, a block size of 6 and an allocation ratio of 2:1 would lead to random assignment of 4 subjects to one group and 2 to the other. This type of randomization can be combined with «stratified randomization», for example by center in a multicenter trial, to «ensure good balance of participant characteristics in each group.»[3] A special case of permuted-block randomization is random allocation, in which the entire sample is treated as one block.[46] The major disadvantage of permuted-block randomization is that even if the block sizes are large and randomly varied, the procedure can lead to selection bias.[48] Another disadvantage is that «proper» analysis of data from permuted-block-randomized RCTs requires stratification by blocks.[52]
  • Adaptive biased-coin randomization methods (of which urn randomization is the most widely known type): In these relatively uncommon methods, the probability of being assigned to a group decreases if the group is overrepresented and increases if the group is underrepresented.[46] The methods are thought to be less affected by selection bias than permuted-block randomization.[52]

Adaptive[edit]

At least two types of «adaptive» randomization procedures have been used in RCTs, but much less frequently than simple or restricted randomization:

  • Covariate-adaptive randomization, of which one type is minimization: The probability of being assigned to a group varies in order to minimize «covariate imbalance.»[52] Minimization is reported to have «supporters and detractors»[46] because only the first subject’s group assignment is truly chosen at random, the method does not necessarily eliminate bias on unknown factors.[3]
  • Response-adaptive randomization, also known as outcome-adaptive randomization: The probability of being assigned to a group increases if the responses of the prior patients in the group were favorable.[52] Although arguments have been made that this approach is more ethical than other types of randomization when the probability that a treatment is effective or ineffective increases during the course of an RCT, ethicists have not yet studied the approach in detail.[53]

Allocation concealment[edit]

«Allocation concealment» (defined as «the procedure for protecting the randomization process so that the treatment to be allocated is not known before the patient is entered into the study») is important in RCTs.[54] In practice, clinical investigators in RCTs often find it difficult to maintain impartiality. Stories abound of investigators holding up sealed envelopes to lights or ransacking offices to determine group assignments in order to dictate the assignment of their next patient.[46] Such practices introduce selection bias and confounders (both of which should be minimized by randomization), possibly distorting the results of the study.[46] Adequate allocation concealment should defeat patients and investigators from discovering treatment allocation once a study is underway and after the study has concluded. Treatment related side-effects or adverse events may be specific enough to reveal allocation to investigators or patients thereby introducing bias or influencing any subjective parameters collected by investigators or requested from subjects.

Some standard methods of ensuring allocation concealment include sequentially numbered, opaque, sealed envelopes (SNOSE); sequentially numbered containers; pharmacy controlled randomization; and central randomization.[46] It is recommended that allocation concealment methods be included in an RCT’s protocol, and that the allocation concealment methods should be reported in detail in a publication of an RCT’s results; however, a 2005 study determined that most RCTs have unclear allocation concealment in their protocols, in their publications, or both.[55] On the other hand, a 2008 study of 146 meta-analyses concluded that the results of RCTs with inadequate or unclear allocation concealment tended to be biased toward beneficial effects only if the RCTs’ outcomes were subjective as opposed to objective.[56]

Sample size[edit]

The number of treatment units (subjects or groups of subjects) assigned to control and treatment groups, affects an RCT’s reliability. If the effect of the treatment is small, the number of treatment units in either group may be insufficient for rejecting the null hypothesis in the respective statistical test. The failure to reject the null hypothesis would imply that the treatment shows no statistically significant effect on the treated in a given test. But as the sample size increases, the same RCT may be able to demonstrate a significant effect of the treatment, even if this effect is small.[57]

Blinding[edit]

An RCT may be blinded, (also called «masked») by «procedures that prevent study participants, caregivers, or outcome assessors from knowing which intervention was received.»[56] Unlike allocation concealment, blinding is sometimes inappropriate or impossible to perform in an RCT; for example, if an RCT involves a treatment in which active participation of the patient is necessary (e.g., physical therapy), participants cannot be blinded to the intervention.

Traditionally, blinded RCTs have been classified as «single-blind», «double-blind», or «triple-blind»; however, in 2001 and 2006 two studies showed that these terms have different meanings for different people.[58][59] The 2010 CONSORT Statement specifies that authors and editors should not use the terms «single-blind», «double-blind», and «triple-blind»; instead, reports of blinded RCT should discuss «If done, who was blinded after assignment to interventions (for example, participants, care providers, those assessing outcomes) and how.»[3]

RCTs without blinding are referred to as «unblinded»,[60] «open»,[61] or (if the intervention is a medication) «open-label».[62] In 2008 a study concluded that the results of unblinded RCTs tended to be biased toward beneficial effects only if the RCTs’ outcomes were subjective as opposed to objective;[56] for example, in an RCT of treatments for multiple sclerosis, unblinded neurologists (but not the blinded neurologists) felt that the treatments were beneficial.[63] In pragmatic RCTs, although the participants and providers are often unblinded, it is «still desirable and often possible to blind the assessor or obtain an objective source of data for evaluation of outcomes.»[43]

Analysis of data[edit]

The types of statistical methods used in RCTs depend on the characteristics of the data and include:

  • For dichotomous (binary) outcome data, logistic regression (e.g., to predict sustained virological response after receipt of peginterferon alfa-2a for hepatitis C[64]) and other methods can be used.
  • For continuous outcome data, analysis of covariance (e.g., for changes in blood lipid levels after receipt of atorvastatin after acute coronary syndrome[65]) tests the effects of predictor variables.
  • For time-to-event outcome data that may be censored, survival analysis (e.g., Kaplan–Meier estimators and Cox proportional hazards models for time to coronary heart disease after receipt of hormone replacement therapy in menopause[66]) is appropriate.

Regardless of the statistical methods used, important considerations in the analysis of RCT data include:

  • Whether an RCT should be stopped early due to interim results. For example, RCTs may be stopped early if an intervention produces «larger than expected benefit or harm», or if «investigators find evidence of no important difference between experimental and control interventions.»[3]
  • The extent to which the groups can be analyzed exactly as they existed upon randomization (i.e., whether a so-called «intention-to-treat analysis» is used). A «pure» intention-to-treat analysis is «possible only when complete outcome data are available» for all randomized subjects;[67] when some outcome data are missing, options include analyzing only cases with known outcomes and using imputed data.[3] Nevertheless, the more that analyses can include all participants in the groups to which they were randomized, the less bias that an RCT will be subject to.[3]
  • Whether subgroup analysis should be performed. These are «often discouraged» because multiple comparisons may produce false positive findings that cannot be confirmed by other studies.[3]

Reporting of results[edit]

The CONSORT 2010 Statement is «an evidence-based, minimum set of recommendations for reporting RCTs.»[68] The CONSORT 2010 checklist contains 25 items (many with sub-items) focusing on «individually randomised, two group, parallel trials» which are the most common type of RCT.[1]

For other RCT study designs, «CONSORT extensions» have been published, some examples are:

  • Consort 2010 Statement: Extension to Cluster Randomised Trials[69]
  • Consort 2010 Statement: Non-Pharmacologic Treatment Interventions[70][71]

Relative importance and observational studies[edit]

Two studies published in The New England Journal of Medicine in 2000 found that observational studies and RCTs overall produced similar results.[72][73] The authors of the 2000 findings questioned the belief that «observational studies should not be used for defining evidence-based medical care» and that RCTs’ results are «evidence of the highest grade.»[72][73] However, a 2001 study published in Journal of the American Medical Association concluded that «discrepancies beyond chance do occur and differences in estimated magnitude of treatment effect are very common» between observational studies and RCTs.[74] According to a 2014 Cochrane review, there is little evidence for significant effect differences between observational studies and randomized controlled trials, regardless of design, heterogeneity, or inclusion of studies of interventions that assessed drug effects.[75]

Two other lines of reasoning question RCTs’ contribution to scientific knowledge beyond other types of studies:

  • If study designs are ranked by their potential for new discoveries, then anecdotal evidence would be at the top of the list, followed by observational studies, followed by RCTs.[76]
  • RCTs may be unnecessary for treatments that have dramatic and rapid effects relative to the expected stable or progressively worse natural course of the condition treated.[77][78] One example is combination chemotherapy including cisplatin for metastatic testicular cancer, which increased the cure rate from 5% to 60% in a 1977 non-randomized study.[78][79]

Interpretation of statistical results[edit]

Like all statistical methods, RCTs are subject to both type I («false positive») and type II («false negative») statistical errors. Regarding Type I errors, a typical RCT will use 0.05 (i.e., 1 in 20) as the probability that the RCT will falsely find two equally effective treatments significantly different.[80] Regarding Type II errors, despite the publication of a 1978 paper noting that the sample sizes of many «negative» RCTs were too small to make definitive conclusions about the negative results,[81] by 2005-2006 a sizeable proportion of RCTs still had inaccurate or incompletely reported sample size calculations.[82]

Peer review[edit]

Peer review of results is an important part of the scientific method. Reviewers examine the study results for potential problems with design that could lead to unreliable results (for example by creating a systematic bias), evaluate the study in the context of related studies and other evidence, and evaluate whether the study can be reasonably considered to have proven its conclusions. To underscore the need for peer review and the danger of overgeneralizing conclusions, two Boston-area medical researchers performed a randomized controlled trial in which they randomly assigned either a parachute or an empty backpack to 23 volunteers who jumped from either a biplane or a helicopter. The study was able to accurately report that parachutes fail to reduce injury compared to empty backpacks. The key context that limited the general applicability of this conclusion was that the aircraft were parked on the ground, and participants had only jumped about two feet.[83]

Advantages[edit]

RCTs are considered to be the most reliable form of scientific evidence in the hierarchy of evidence that influences healthcare policy and practice because RCTs reduce spurious causality and bias. Results of RCTs may be combined in systematic reviews which are increasingly being used in the conduct of evidence-based practice. Some examples of scientific organizations’ considering RCTs or systematic reviews of RCTs to be the highest-quality evidence available are:

  • As of 1998, the National Health and Medical Research Council of Australia designated «Level I» evidence as that «obtained from a systematic review of all relevant randomised controlled trials» and «Level II» evidence as that «obtained from at least one properly designed randomised controlled trial.»[84]
  • Since at least 2001, in making clinical practice guideline recommendations the United States Preventive Services Task Force has considered both a study’s design and its internal validity as indicators of its quality.[85] It has recognized «evidence obtained from at least one properly randomized controlled trial» with good internal validity (i.e., a rating of «I-good») as the highest quality evidence available to it.[85]
  • The GRADE Working Group concluded in 2008 that «randomised trials without important limitations constitute high quality evidence.»[86]
  • For issues involving «Therapy/Prevention, Aetiology/Harm», the Oxford Centre for Evidence-based Medicine as of 2011 defined «Level 1a» evidence as a systematic review of RCTs that are consistent with each other, and «Level 1b» evidence as an «individual RCT (with narrow Confidence Interval).»[87]

Notable RCTs with unexpected results that contributed to changes in clinical practice include:

  • After Food and Drug Administration approval, the antiarrhythmic agents flecainide and encainide came to market in 1986 and 1987 respectively.[88] The non-randomized studies concerning the drugs were characterized as «glowing»,[89] and their sales increased to a combined total of approximately 165,000 prescriptions per month in early 1989.[88] In that year, however, a preliminary report of an RCT concluded that the two drugs increased mortality.[90] Sales of the drugs then decreased.[88]
  • Prior to 2002, based on observational studies, it was routine for physicians to prescribe hormone replacement therapy for post-menopausal women to prevent myocardial infarction.[89] In 2002 and 2004, however, published RCTs from the Women’s Health Initiative claimed that women taking hormone replacement therapy with estrogen plus progestin had a higher rate of myocardial infarctions than women on a placebo, and that estrogen-only hormone replacement therapy caused no reduction in the incidence of coronary heart disease.[66][91] Possible explanations for the discrepancy between the observational studies and the RCTs involved differences in methodology, in the hormone regimens used, and in the populations studied.[92][93] The use of hormone replacement therapy decreased after publication of the RCTs.[94]

Disadvantages[edit]

Many papers discuss the disadvantages of RCTs.[77][95][96] Among the most frequently cited drawbacks are:

Time and costs[edit]

RCTs can be expensive;[96] one study found 28 Phase III RCTs funded by the National Institute of Neurological Disorders and Stroke prior to 2000 with a total cost of US$335 million,[97] for a mean cost of US$12 million per RCT. Nevertheless, the return on investment of RCTs may be high, in that the same study projected that the 28 RCTs produced a «net benefit to society at 10-years» of 46 times the cost of the trials program, based on evaluating a quality-adjusted life year as equal to the prevailing mean per capita gross domestic product.[97]

The conduct of an RCT takes several years until being published; thus, data is restricted from the medical community for long years and may be of less relevance at time of publication.[98]

It is costly to maintain RCTs for the years or decades that would be ideal for evaluating some interventions.[77][96]

Interventions to prevent events that occur only infrequently (e.g., sudden infant death syndrome) and uncommon adverse outcomes (e.g., a rare side effect of a drug) would require RCTs with extremely large sample sizes and may, therefore, best be assessed by observational studies.[77]

Due to the costs of running RCTs, these usually only inspect one variable or very few variables, rarely reflecting the full picture of a complicated medical situation; whereas the case report, for example, can detail many aspects of the patient’s medical situation (e.g. patient history, physical examination, diagnosis, psychosocial aspects, follow up).[98]

Conflict of interest dangers[edit]

A 2011 study done to disclose possible conflicts of interests in underlying research studies used for medical meta-analyses reviewed 29 meta-analyses and found that conflicts of interests in the studies underlying the meta-analyses were rarely disclosed. The 29 meta-analyses included 11 from general medicine journals; 15 from specialty medicine journals, and 3 from the Cochrane Database of Systematic Reviews. The 29 meta-analyses reviewed an aggregate of 509 randomized controlled trials (RCTs). Of these, 318 RCTs reported funding sources with 219 (69%) industry funded. 132 of the 509 RCTs reported author conflict of interest disclosures, with 91 studies (69%) disclosing industry financial ties with one or more authors. The information was, however, seldom reflected in the meta-analyses. Only two (7%) reported RCT funding sources and none reported RCT author-industry ties. The authors concluded «without acknowledgment of COI due to industry funding or author industry financial ties from RCTs included in meta-analyses, readers’ understanding and appraisal of the evidence from the meta-analysis may be compromised.»[99]

Some RCTs are fully or partly funded by the health care industry (e.g., the pharmaceutical industry) as opposed to government, nonprofit, or other sources. A systematic review published in 2003 found four 1986–2002 articles comparing industry-sponsored and nonindustry-sponsored RCTs, and in all the articles there was a correlation of industry sponsorship and positive study outcome.[100] A 2004 study of 1999–2001 RCTs published in leading medical and surgical journals determined that industry-funded RCTs «are more likely to be associated with statistically significant pro-industry findings.»[101] These results have been mirrored in trials in surgery, where although industry funding did not affect the rate of trial discontinuation it was however associated with a lower odds of publication for completed trials.[102] One possible reason for the pro-industry results in industry-funded published RCTs is publication bias.[101] Other authors have cited the differing goals of academic and industry sponsored research as contributing to the difference. Commercial sponsors may be more focused on performing trials of drugs that have already shown promise in early stage trials, and on replicating previous positive results to fulfill regulatory requirements for drug approval.[103]

Ethics[edit]

If a disruptive innovation in medical technology is developed, it may be difficult to test this ethically in an RCT if it becomes «obvious» that the control subjects have poorer outcomes—either due to other foregoing testing, or within the initial phase of the RCT itself. Ethically it may be necessary to abort the RCT prematurely, and getting ethics approval (and patient agreement) to withhold the innovation from the control group in future RCT’s may not be feasible.

Historical control trials (HCT) exploit the data of previous RCTs to reduce the sample size; however, these approaches are controversial in the scientific community and must be handled with care.[104]

[edit]

Due to the recent emergence of RCTs in social science, the use of RCTs in social sciences is a contested issue. Some writers from a medical or health background have argued that existing research in a range of social science disciplines lacks rigour, and should be improved by greater use of randomized control trials.

Transport science[edit]

Researchers in transport science argue that public spending on programmes such as school travel plans could not be justified unless their efficacy is demonstrated by randomized controlled trials.[105] Graham-Rowe and colleagues[106] reviewed 77 evaluations of transport interventions found in the literature, categorising them into 5 «quality levels». They concluded that most of the studies were of low quality and advocated the use of randomized controlled trials wherever possible in future transport research.

Dr. Steve Melia[107] took issue with these conclusions, arguing that claims about the advantages of RCTs, in establishing causality and avoiding bias, have been exaggerated. He proposed the following eight criteria for the use of RCTs in contexts where interventions must change human behaviour to be effective:

The intervention:

  1. Has not been applied to all members of a unique group of people (e.g. the population of a whole country, all employees of a unique organisation etc.)
  2. Is applied in a context or setting similar to that which applies to the control group
  3. Can be isolated from other activities—and the purpose of the study is to assess this isolated effect
  4. Has a short timescale between its implementation and maturity of its effects

And the causal mechanisms:

  1. Are either known to the researchers, or else all possible alternatives can be tested
  2. Do not involve significant feedback mechanisms between the intervention group and external environments
  3. Have a stable and predictable relationship to exogenous factors
  4. Would act in the same way if the control group and intervention group were reversed

Criminology[edit]

A 2005 review found 83 randomized experiments in criminology published in 1982–2004, compared with only 35 published in 1957–1981.[108] The authors classified the studies they found into five categories: «policing», «prevention», «corrections», «court», and «community».[108] Focusing only on offending behavior programs, Hollin (2008) argued that RCTs may be difficult to implement (e.g., if an RCT required «passing sentences that would randomly assign offenders to programmes») and therefore that experiments with quasi-experimental design are still necessary.[109]

Education[edit]

RCTs have been used in evaluating a number of educational interventions. Between 1980 and 2016, over 1,000 reports of RCTs have been published.[110] For example, a 2009 study randomized 260 elementary school teachers’ classrooms to receive or not receive a program of behavioral screening, classroom intervention, and parent training, and then measured the behavioral and academic performance of their students.[111] Another 2009 study randomized classrooms for 678 first-grade children to receive a classroom-centered intervention, a parent-centered intervention, or no intervention, and then followed their academic outcomes through age 19.[112]

Criticism[edit]

A 2018 review of the 10 most cited randomised controlled trials noted poor distribution of background traits, difficulties with blinding, and discussed other assumptions and biases inherent in randomised controlled trials. These include the «unique time period assessment bias», the «background traits remain constant assumption», the «average treatment effects limitation», the «simple treatment at the individual level limitation», the «all preconditions are fully met assumption», the «quantitative variable limitation» and the «placebo only or conventional treatment only limitation».[113]

See also[edit]

  • Drug development
  • Hypothesis testing
  • Impact evaluation
  • Jadad scale
  • Pipeline planning
  • Royal Commission on Animal Magnetism
  • Statistical inference

References[edit]

  1. ^ a b c Schulz KF, Altman DG, ((Moher D; for the CONSORT Group)) (2010). «CONSORT 2010 Statement: updated guidelines for reporting parallel group randomised trials». Br Med J. 340: c332. doi:10.1136/bmj.c332. PMC 2844940. PMID 20332509.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  2. ^
  3. ^ a b c d e f g h i Moher D, Hopewell S, Schulz KF, Montori V, Gøtzsche PC, Devereaux PJ, Elbourne D, Egger M, Altman DG (2010). «CONSORT 2010 explanation and elaboration: updated guidelines for reporting parallel group randomised trials». Br Med J. 340: c869. doi:10.1136/bmj.c869. PMC 2844943. PMID 20332511.
  4. ^ Hannan EL (June 2008). «Randomized clinical trials and observational studies: guidelines for assessing respective strengths and limitations». JACC. Cardiovascular Interventions. 1 (3): 211–7. doi:10.1016/j.jcin.2008.01.008. PMID 19463302.
  5. ^ Ranjith G (2005). «Interferon-α-induced depression: when a randomized trial is not a randomized controlled trial». Psychother Psychosom. 74 (6): 387, author reply 387–8. doi:10.1159/000087787. PMID 16244516. S2CID 143644933.
  6. ^ Peto R, Pike MC, Armitage P, Breslow NE, Cox DR, Howard SV, Mantel N, McPherson K, Peto J, Smith PG (1976). «Design and analysis of randomized clinical trials requiring prolonged observation of each patient. I. Introduction and design». Br J Cancer. 34 (6): 585–612. doi:10.1038/bjc.1976.220. PMC 2025229. PMID 795448.
  7. ^ Peto R, Pike MC, Armitage P, Breslow NE, Cox DR, Howard SV, Mantel N, McPherson K, Peto J, Smith PG (1977). «Design and analysis of randomized clinical trials requiring prolonged observation of each patient. II. Analysis and examples». Br J Cancer. 35 (1): 1–39. doi:10.1038/bjc.1977.1. PMC 2025310. PMID 831755.
  8. ^ Wollert KC, Meyer GP, Lotz J, Ringes-Lichtenberg S, Lippolt P, Breidenbach C, Fichtner S, Korte T, Hornig B, Messinger D, Arseniev L, Hertenstein B, Ganser A, Drexler H (2004). «Intracoronary autologous bone-marrow cell transfer after myocardial infarction: the BOOST randomised controlled clinical trial». Lancet. 364 (9429): 141–8. doi:10.1016/S0140-6736(04)16626-9. PMID 15246726. S2CID 24361586.
  9. ^ Dunn PM (January 1997). «James Lind (1716-94) of Edinburgh and the treatment of scurvy». Arch. Dis. Child. Fetal Neonatal Ed. 76 (1): F64–5. doi:10.1136/fn.76.1.f64. PMC 1720613. PMID 9059193.
  10. ^
    Daston L (2005). «Scientific Error and the Ethos of Belief». Social Research. 72 (1): 18. doi:10.1353/sor.2005.0016. S2CID 141036212.
  11. ^ Rivers WH, Webber HN (August 1907). «The action of caffeine on the capacity for muscular work». The Journal of Physiology. 36 (1): 33–47. doi:10.1113/jphysiol.1907.sp001215. PMC 1533733. PMID 16992882.
  12. ^ Charles Sanders Peirce and Joseph Jastrow (1885). «On Small Differences in Sensation». Memoirs of the National Academy of Sciences. 3: 73–83. http://psychclassics.yorku.ca/Peirce/small-diffs.htm
  13. ^ Hacking, Ian (September 1988). «Telepathy: Origins of Randomization in Experimental Design». Isis. A Special Issue on Artifact and Experiment. 79 (3): 427–451. doi:10.1086/354775. JSTOR 234674. MR 1013489. S2CID 52201011.
  14. ^ Stephen M. Stigler (November 1992). «A Historical View of Statistical Concepts in Psychology and Educational Research». American Journal of Education. 101 (1): 60–70. doi:10.1086/444032. S2CID 143685203.
  15. ^ Trudy Dehue (December 1997). «Deception, Efficiency, and Random Groups: Psychology and the Gradual Origination of the Random Group Design» (PDF). Isis. 88 (4): 653–673. doi:10.1086/383850. PMID 9519574. S2CID 23526321.
  16. ^ Neyman, Jerzy. 1923 [1990]. «On the Application of Probability Theory to AgriculturalExperiments. Essay on Principles. Section 9.» Statistical Science 5 (4): 465–472. Trans. Dorota M. Dabrowska and Terence P. Speed.
  17. ^
    According to Denis Conniffe:

    Ronald A. Fisher was «interested in application and in the popularization
    of statistical methods and his early book Statistical Methods for Research Workers, published in 1925, went through many editions and
    motivated and influenced the practical use of statistics in many fields of
    study. His Design of Experiments (1935) [promoted] statistical technique and application. In that book he
    emphasized examples and how to design experiments systematically from
    a statistical point of view. The mathematical justification of the methods
    described was not stressed and, indeed, proofs were often barely sketched
    or omitted altogether …, a fact which led H. B. Mann to fill the gaps with a rigorous mathematical treatment in his well known treatise, Mann (1949).»

    Conniffe, Denis (1990–1991). «R. A. Fisher and the development of statistics—a view in his centenary year». Journal of the Statistical and Social Inquiry Society of Ireland. Vol. XXVI, no. 3. Dublin: Statistical and Social Inquiry Society of Ireland. p. 87. hdl:2262/2764. ISSN 0081-4776.

    Mann, H. B. (1949). Analysis and design of experiments: Analysis of variance and analysis of variance designs. New York, N. Y.: Dover Publications, Inc. pp. x+195. MR 0032177.

  18. ^ Streptomycin in Tuberculosis Trials Committee (1948). «Streptomycin treatment of pulmonary tuberculosis. A Medical Research Council investigation». Br Med J. 2 (4582): 769–82. doi:10.1136/bmj.2.4582.769. PMC 2091872. PMID 18890300.
  19. ^ Brown D (1998-11-02). «Landmark study made research resistant to bias». Washington Post.
  20. ^ Shikata S, Nakayama T, Noguchi Y, Taji Y, Yamagishi H (2006). «Comparison of effects in randomized controlled trials with observational studies in digestive surgery». Ann Surg. 244 (5): 668–76. doi:10.1097/01.sla.0000225356.04304.bc. PMC 1856609. PMID 17060757.
  21. ^ a b Stolberg HO, Norman G, Trop I (2004). «Randomized controlled trials». Am J Roentgenol. 183 (6): 1539–44. doi:10.2214/ajr.183.6.01831539. PMID 15547188. S2CID 5376391.
  22. ^ Georgina Ferry (2 November 2020). «Peter Sleight Obituary». The Guardian. Retrieved 3 November 2020.
  23. ^ Meldrum ML (2000). «A brief history of the randomized controlled trial. From oranges and lemons to the gold standard». Hematol Oncol Clin North Am. 14 (4): 745–60, vii. doi:10.1016/S0889-8588(05)70309-9. PMID 10949771.
  24. ^ Freedman B (1987). «Equipoise and the ethics of clinical research». N Engl J Med. 317 (3): 141–5. doi:10.1056/NEJM198707163170304. PMID 3600702.
  25. ^ Gifford F (1995). «Community-equipoise and the ethics of randomized clinical trials». Bioethics. 9 (2): 127–48. doi:10.1111/j.1467-8519.1995.tb00306.x. PMID 11653056.
  26. ^ Edwards SJ, Lilford RJ, Hewison J (1998). «The ethics of randomised controlled trials from the perspectives of patients, the public, and healthcare professionals». Br Med J. 317 (7167): 1209–12. doi:10.1136/bmj.317.7167.1209. PMC 1114158. PMID 9794861.
  27. ^ Zelen M (1979). «A new design for randomized clinical trials». N Engl J Med. 300 (22): 1242–5. doi:10.1056/NEJM197905313002203. PMID 431682.
  28. ^ Torgerson DJ, Roland M (1998). «What is Zelen’s design?». Br Med J. 316 (7131): 606. doi:10.1136/bmj.316.7131.606. PMC 1112637. PMID 9518917.
  29. ^ Appelbaum PS, Roth LH, Lidz C (1982). «The therapeutic misconception: informed consent in psychiatric research». Int J Law Psychiatry. 5 (3–4): 319–29. doi:10.1016/0160-2527(82)90026-7. PMID 6135666.
  30. ^ a b Henderson GE, Churchill LR, Davis AM, Easter MM, Grady C, Joffe S, Kass N, King NM, Lidz CW, Miller FG, Nelson DK, Peppercorn J, Rothschild BB, Sankar P, Wilfond BS, Zimmer CR (2007). «Clinical trials and medical care: defining the therapeutic misconception». PLoS Med. 4 (11): e324. doi:10.1371/journal.pmed.0040324. PMC 2082641. PMID 18044980.
  31. ^ Jain SL (2010). «The mortality effect: counting the dead in the cancer trial» (PDF). Public Culture. 21 (1): 89–117. doi:10.1215/08992363-2009-017. S2CID 143641293. Archived from the original (PDF) on 2020-02-20.
  32. ^ De Angelis C, Drazen JM, Frizelle FA, et al. (September 2004). «Clinical trial registration: a statement from the International Committee of Medical Journal Editors». The New England Journal of Medicine. 351 (12): 1250–1. doi:10.1056/NEJMe048225. PMID 15356289.
  33. ^ Law MR, Kawasumi Y, Morgan SG (2011). «Despite law, fewer than one in eight completed studies of drugs and biologics are reported on time on ClinicalTrials.gov». Health Aff (Millwood). 30 (12): 2338–45. doi:10.1377/hlthaff.2011.0172. PMID 22147862.
  34. ^ Mathieu S, Boutron I, Moher D, Altman DG, Ravaud P (2009). «Comparison of registered and published primary outcomes in randomized controlled trials». JAMA. 302 (9): 977–84. doi:10.1001/jama.2009.1242. PMID 19724045.
  35. ^ Bhaumik, S (Mar 2013). «Editorial policies of MEDLINE indexed Indian journals on clinical trial registration». Indian Pediatr. 50 (3): 339–40. doi:10.1007/s13312-013-0092-2. PMID 23680610. S2CID 40317464.
  36. ^ a b Hopewell S, Dutton S, Yu LM, Chan AW, Altman DG (2010). «The quality of reports of randomised trials in 2000 and 2006: comparative study of articles indexed in PubMed». BMJ. 340: c723. doi:10.1136/bmj.c723. PMC 2844941. PMID 20332510.
  37. ^ Kaiser, Joerg; Niesen, Willem; Probst, Pascal; Bruckner, Thomas; Doerr-Harim, Colette; Strobel, Oliver; Knebel, Phillip; Diener, Markus K.; Mihaljevic, André L.; Büchler, Markus W.; Hackert, Thilo (7 June 2019). «Abdominal drainage versus no drainage after distal pancreatectomy: study protocol for a randomized controlled trial». Trials. 20 (1): 332. doi:10.1186/s13063-019-3442-0. PMC 6555976. PMID 31174583.
  38. ^ Farag, Sara M.; Mohammed, Manal O.; EL-Sobky, Tamer A.; ElKadery, Nadia A.; ElZohiery, Abeer K. (March 2020). «Botulinum Toxin A Injection in Treatment of Upper Limb Spasticity in Children with Cerebral Palsy: A Systematic Review of Randomized Controlled Trials». JBJS Reviews. 8 (3): e0119. doi:10.2106/JBJS.RVW.19.00119. PMC 7161716. PMID 32224633.
  39. ^ Jones, Byron; Kenward, Michael G. (2003). Design and Analysis of Cross-Over Trials (Second ed.). London: Chapman and Hall.
  40. ^
    Vonesh, Edward F.; Chinchilli, Vernon G. (1997). «Crossover Experiments». Linear and Nonlinear Models for the Analysis of Repeated Measurements. London: Chapman and Hall. pp. 111–202.
  41. ^ Gall, Stefanie; Adams, Larissa; Joubert, Nandi; Ludyga, Sebastian; Müller, Ivan; Nqweniso, Siphesihle; Pühse, Uwe; du Randt, Rosa; Seelig, Harald; Smith, Danielle; Steinmann, Peter; Utzinger, Jürg; Walter, Cheryl; Gerber, Markus; van Wouwe, Jacobus P. (8 November 2018). «Effect of a 20-week physical activity intervention on selective attention and academic performance in children living in disadvantaged neighborhoods: A cluster randomized control trial». PLOS ONE. 13 (11): e0206908. Bibcode:2018PLoSO..1306908G. doi:10.1371/journal.pone.0206908. PMC 6224098. PMID 30408073.
  42. ^ Gladstone, Melissa J.; Chandna, Jaya; Kandawasvika, Gwendoline; Ntozini, Robert; Majo, Florence D.; Tavengwa, Naume V.; Mbuya, Mduduzi N. N.; Mangwadu, Goldberg T.; Chigumira, Ancikaria; Chasokela, Cynthia M.; Moulton, Lawrence H.; Stoltzfus, Rebecca J.; Humphrey, Jean H.; Prendergast, Andrew J.; Tumwine, James K. (21 March 2019). «Independent and combined effects of improved water, sanitation, and hygiene (WASH) and improved complementary feeding on early neurodevelopment among children born to HIV-negative mothers in rural Zimbabwe: Substudy of a cluster-randomized trial». PLOS Medicine. 16 (3): e1002766. doi:10.1371/journal.pmed.1002766. PMC 6428259. PMID 30897095.
  43. ^ a b c d Zwarenstein M, Treweek S, Gagnier JJ, Altman DG, Tunis S, Haynes B, Oxman AD, Moher D; CONSORT group; Pragmatic Trials in Healthcare (Practihc) group (2008). «Improving the reporting of pragmatic trials: an extension of the CONSORT statement». BMJ. 337: a2390. doi:10.1136/bmj.a2390. PMC 3266844. PMID 19001484.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  44. ^ a b c d Piaggio G, Elbourne DR, Altman DG, Pocock SJ, Evans SJ; CONSORT Group (2006). «Reporting of noninferiority and equivalence randomized trials: an extension of the CONSORT statement» (PDF). JAMA. 295 (10): 1152–60. doi:10.1001/jama.295.10.1152. PMID 16522836.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  45. ^ a b c Schulz KF, Grimes DA (2002). «Generation of allocation sequences in randomised trials: chance, not choice» (PDF). Lancet. 359 (9305): 515–9. doi:10.1016/S0140-6736(02)07683-3. PMID 11853818. S2CID 291300.[dead link]
  46. ^ a b c d e f g h Schulz KF, Grimes DA (2002). «Allocation concealment in randomised trials: defending against deciphering» (PDF). Lancet. 359 (9306): 614–8. doi:10.1016/S0140-6736(02)07750-4. PMID 11867132. S2CID 12902486. Archived from the original (PDF) on September 11, 2012.
  47. ^ Howick J, Mebius A (2014). «In search of justification for the unpredictability paradox». Trials. 15: 480. doi:10.1186/1745-6215-15-480. PMC 4295227. PMID 25490908.
  48. ^ a b Lachin JM (1988). «Statistical properties of randomization in clinical trials». Controlled Clinical Trials. 9 (4): 289–311. doi:10.1016/0197-2456(88)90045-1. PMID 3060315.
  49. ^ Rosenberger, James. «STAT 503 — Design of Experiments». Pennsylvania State University. Retrieved 24 September 2012.
  50. ^ Avins, A L (1998). ««Can unequal be more fair? Ethics, subject allocation, and randomized clinical trials»«. J Med Ethics. 24 (6): 401–408. doi:10.1136/jme.24.6.401. PMC 479141. PMID 9873981.
  51. ^ Buyse ME (1989). «Analysis of clinical trial outcomes: some comments on subgroup analyses». Controlled Clinical Trials. 10 (4 Suppl): 187S–194S. doi:10.1016/0197-2456(89)90057-3. PMID 2605967.
  52. ^ a b c d e f Lachin JM, Matts JP, Wei LJ (1988). «Randomization in clinical trials: conclusions and recommendations» (PDF). Controlled Clinical Trials. 9 (4): 365–74. doi:10.1016/0197-2456(88)90049-9. hdl:2027.42/27041. PMID 3203526.
  53. ^ Rosenberger WF, Lachin JM (1993). «The use of response-adaptive designs in clinical trials». Controlled Clinical Trials. 14 (6): 471–84. doi:10.1016/0197-2456(93)90028-C. PMID 8119063.
  54. ^ Forder PM, Gebski VJ, Keech AC (2005). «Allocation concealment and blinding: when ignorance is bliss». Med J Aust. 182 (2): 87–9. doi:10.5694/j.1326-5377.2005.tb06584.x. PMID 15651970. S2CID 202149.
  55. ^ Pildal J, Chan AW, Hróbjartsson A, Forfang E, Altman DG, Gøtzsche PC (2005). «Comparison of descriptions of allocation concealment in trial protocols and the published reports: cohort study». BMJ. 330 (7499): 1049. doi:10.1136/bmj.38414.422650.8F. PMC 557221. PMID 15817527.
  56. ^ a b c Wood L, Egger M, Gluud LL, Schulz KF, Jüni P, Altman DG, Gluud C, Martin RM, Wood AJ, Sterne JA (2008). «Empirical evidence of bias in treatment effect estimates in controlled trials with different interventions and outcomes: meta-epidemiological study». BMJ. 336 (7644): 601–5. doi:10.1136/bmj.39465.451748.AD. PMC 2267990. PMID 18316340.
  57. ^ Glennerster, Rachel; Kudzai Takavarasha (2013). ««Chapter 6»«. Running randomized evaluations: a practical guide. Princeton: Princeton University Press. ISBN 9780691159249. JSTOR j.ctt4cgd52.
  58. ^ Devereaux PJ, Manns BJ, Ghali WA, Quan H, Lacchetti C, Montori VM, Bhandari M, Guyatt GH (2001). «Physician interpretations and textbook definitions of blinding terminology in randomized controlled trials». J Am Med Assoc. 285 (15): 2000–3. doi:10.1001/jama.285.15.2000. PMID 11308438.
  59. ^ Haahr MT, Hróbjartsson A (2006). «Who is blinded in randomized clinical trials? A study of 200 trials and a survey of authors». Clin Trials. 3 (4): 360–5. doi:10.1177/1740774506069153. PMID 17060210. S2CID 23818514.
  60. ^ Marson AG, Al-Kharusi AM, Alwaidh M, Appleton R, Baker GA, Chadwick DW, et al. (2007). «The SANAD study of effectiveness of valproate, lamotrigine, or topiramate for generalised and unclassifiable epilepsy: an unblinded randomised controlled trial». Lancet. 369 (9566): 1016–26. doi:10.1016/S0140-6736(07)60461-9. PMC 2039891. PMID 17382828.
  61. ^ Chan R, Hemeryck L, O’Regan M, Clancy L, Feely J (1995). «Oral versus intravenous antibiotics for community acquired lower respiratory tract infection in a general hospital: open, randomised controlled trial». BMJ. 310 (6991): 1360–2. doi:10.1136/bmj.310.6991.1360. PMC 2549744. PMID 7787537.
  62. ^ Fukase K, Kato M, Kikuchi S, Inoue K, Uemura N, Okamoto S, Terao S, Amagai K, Hayashi S, Asaka M; Japan Gast Study Group (2008). «Effect of eradication of Helicobacter pylori on incidence of metachronous gastric carcinoma after endoscopic resection of early gastric cancer: an open-label, randomised controlled trial» (PDF). Lancet. 372 (9636): 392–7. doi:10.1016/S0140-6736(08)61159-9. hdl:2115/34681. PMID 18675689. S2CID 13741892.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  63. ^ Noseworthy JH, Ebers GC, Vandervoort MK, Farquhar RE, Yetisir E, Roberts R (1994). «The impact of blinding on the results of a randomized, placebo-controlled multiple sclerosis clinical trial». Neurology. 44 (1): 16–20. doi:10.1212/wnl.44.1.16. PMID 8290055. S2CID 2663997.
  64. ^ Manns MP, McHutchison JG, Gordon SC, Rustgi VK, Shiffman M, Reindollar R, Goodman ZD, Koury K, Ling M, Albrecht JK (2001). «Peginterferon alfa-2b plus ribavirin compared with interferon alfa-2b plus ribavirin for initial treatment of chronic hepatitis C: a randomised trial». Lancet. 358 (9286): 958–65. doi:10.1016/S0140-6736(01)06102-5. PMID 11583749. S2CID 14583372.
  65. ^ Schwartz GG, Olsson AG, Ezekowitz MD, Ganz P, Oliver MF, Waters D, Zeiher A, Chaitman BR, Leslie S, Stern T; Myocardial Ischemia Reduction with Aggressive Cholesterol Lowering (MIRACL) Study Investigators (2001). «Effects of atorvastatin on early recurrent ischemic events in acute coronary syndromes: the MIRACL study: a randomized controlled trial». J Am Med Assoc. 285 (13): 1711–8. doi:10.1001/jama.285.13.1711. PMID 11277825.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  66. ^ a b Rossouw JE, Anderson GL, Prentice RL, LaCroix AZ, Kooperberg C, Stefanick ML, Jackson RD, Beresford SA, Howard BV, Johnson KC, Kotchen JM, Ockene J; Writing Group for the Women’s Health Initiative Investigators (2002). «Risks and benefits of estrogen plus progestin in healthy postmenopausal women: principal results from the Women’s Health Initiative randomized controlled trial» (PDF). J Am Med Assoc. 288 (3): 321–33. doi:10.1001/jama.288.3.321. PMID 12117397. S2CID 20149703.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  67. ^ Hollis S, Campbell F (1999). «What is meant by intention to treat analysis? Survey of published randomised controlled trials». Br Med J. 319 (7211): 670–4. doi:10.1136/bmj.319.7211.670. PMC 28218. PMID 10480822.
  68. ^ CONSORT Group. «Welcome to the CONSORT statement Website». Retrieved 2010-03-29.
  69. ^ Campbell MK, Piaggio G, Elbourne DR, Altman DG (2012). «Consort 2010 statement: extension to cluster randomised trials». BMJ. 345: e5661. doi:10.1136/bmj.e5661. PMID 22951546.
  70. ^ Boutron I, Moher D, Altman DG, Schulz K, Ravaud P (2008). «Extending the CONSORT Statement to randomized trials of nonpharmacologic treatment: explanation and elaboration». Annals of Internal Medicine. 148 (4): 295–309. doi:10.7326/0003-4819-148-4-200802190-00008. PMID 18283207.
  71. ^ Boutron I, Moher D, Altman DG, Schulz K, Ravaud P (2008). «Methods and Processes of the CONSORT Group: Example of an Extension for Trials Assessing Nonpharmacologic Treatments». Annals of Internal Medicine. 148 (4): W60–6. doi:10.7326/0003-4819-148-4-200802190-00008-w1. PMID 18283201.
  72. ^ a b Benson K, Hartz AJ (2000). «A comparison of observational studies and randomized, controlled trials». N Engl J Med. 342 (25): 1878–86. doi:10.1056/NEJM200006223422506. PMID 10861324.
  73. ^ a b Concato J, Shah N, Horwitz RI (2000). «Randomized, controlled trials, observational studies, and the hierarchy of research designs». N Engl J Med. 342 (25): 1887–92. doi:10.1056/NEJM200006223422507. PMC 1557642. PMID 10861325.
  74. ^ Ioannidis JP, Haidich AB, Pappa M, Pantazis N, Kokori SI, Tektonidou MG, Contopoulos-Ioannidis DG, Lau J (2001). «Comparison of evidence of treatment effects in randomized and nonrandomized studies». J Am Med Assoc. 286 (7): 821–30. CiteSeerX 10.1.1.590.2854. doi:10.1001/jama.286.7.821. PMID 11497536.
  75. ^ Anglemyer A, Horvath HT, Bero L (April 2014). «Healthcare outcomes assessed with observational study designs compared with those assessed in randomized trials». The Cochrane Database of Systematic Reviews. 2014 (4): MR000034. doi:10.1002/14651858.MR000034.pub2. PMC 8191367. PMID 24782322.
  76. ^ Vandenbroucke JP (2008). «Observational research, randomised trials, and two views of medical science». PLoS Med. 5 (3): e67. doi:10.1371/journal.pmed.0050067. PMC 2265762. PMID 18336067.
  77. ^ a b c d Black N (1996). «Why we need observational studies to evaluate the effectiveness of health care». BMJ. 312 (7040): 1215–8. doi:10.1136/bmj.312.7040.1215. PMC 2350940. PMID 8634569.
  78. ^ a b Glasziou P, Chalmers I, Rawlins M, McCulloch P (2007). «When are randomised trials unnecessary? Picking signal from noise». Br Med J. 334 (7589): 349–51. doi:10.1136/bmj.39070.527986.68. PMC 1800999. PMID 17303884.
  79. ^ Einhorn LH (2002). «Curing metastatic testicular cancer». Proc Natl Acad Sci U S A. 99 (7): 4592–5. doi:10.1073/pnas.072067999. PMC 123692. PMID 11904381.
  80. ^ Wittes J (2002). «Sample size calculations for randomized controlled trials». Epidemiol Rev. 24 (1): 39–53. doi:10.1093/epirev/24.1.39. PMID 12119854.
  81. ^
  82. ^ Charles P, Giraudeau B, Dechartres A, Baron G, Ravaud P (2009-05-12). «Reporting of sample size calculation in randomised controlled trials: review». Br Med J. 338: b1732. doi:10.1136/bmj.b1732. PMC 2680945. PMID 19435763.
  83. ^ Richard Harris (22 Dec 2018). «Researchers Show Parachutes Don’t Work, But There’s A Catch».
  84. ^ National Health and Medical Research Council (1998-11-16). A guide to the development, implementation and evaluation of clinical practice guidelines (PDF). Canberra: Commonwealth of Australia. p. 56. ISBN 978-1-86496-048-8. Retrieved 2010-03-28.
  85. ^ a b Harris RP, Helfand M, Woolf SH, Lohr KN, Mulrow CD, Teutsch SM, Atkins D; Methods Work Group, Third US Preventive Services Task Force (2001). «Current methods of the US Preventive Services Task Force: a review of the process» (PDF). Am J Prev Med. 20 (3 Suppl): 21–35. doi:10.1016/S0749-3797(01)00261-6. PMID 11306229.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  86. ^ Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schünemann HJ; GRADE Working Group (2008). «What is «quality of evidence» and why is it important to clinicians?». BMJ. 336 (7651): 995–8. doi:10.1136/bmj.39490.551019.BE. PMC 2364804. PMID 18456631.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  87. ^ Oxford Centre for Evidence-based Medicine (2011-09-16). «Levels of evidence». Retrieved 2012-02-15.
  88. ^ a b c Anderson JL, Pratt CM, Waldo AL, Karagounis LA (1997). «Impact of the Food and Drug Administration approval of flecainide and encainide on coronary artery disease mortality: putting «Deadly Medicine» to the test». Am J Cardiol. 79 (1): 43–7. doi:10.1016/S0002-9149(96)00673-X. PMID 9024734.
  89. ^ a b Rubin R (2006-10-16). «In medicine, evidence can be confusing — deluged with studies, doctors try to sort out what works, what doesn’t». USA Today. Retrieved 2010-03-22.
  90. ^ Cardiac Arrhythmia Suppression Trial (CAST) Investigators (1989). «Preliminary report: effect of encainide and flecainide on mortality in a randomized trial of arrhythmia suppression after myocardial infarction. The Cardiac Arrhythmia Suppression Trial (CAST) Investigators». N Engl J Med. 321 (6): 406–12. doi:10.1056/NEJM198908103210629. PMID 2473403.
  91. ^ Anderson GL, Limacher M, Assaf AR, Bassford T, Beresford SA, Black H, et al. (2004). «Effects of conjugated equine estrogen in postmenopausal women with hysterectomy: the Women’s Health Initiative randomized controlled trial». JAMA. 291 (14): 1701–12. doi:10.1001/jama.291.14.1701. PMID 15082697.
  92. ^ Grodstein F, Clarkson TB, Manson JE (2003). «Understanding the divergent data on postmenopausal hormone therapy». N Engl J Med. 348 (7): 645–50. doi:10.1056/NEJMsb022365. PMID 12584376.
  93. ^ Vandenbroucke JP (2009). «The HRT controversy: observational studies and RCTs fall in line». Lancet. 373 (9671): 1233–5. doi:10.1016/S0140-6736(09)60708-X. PMID 19362661. S2CID 44991220.
  94. ^ Hsu A, Card A, Lin SX, Mota S, Carrasquillo O, Moran A (2009). «Changes in postmenopausal hormone replacement therapy use among women with high cardiovascular risk». Am J Public Health. 99 (12): 2184–7. doi:10.2105/AJPH.2009.159889. PMC 2775780. PMID 19833984.
  95. ^ Bell, S.H., & Peck, L.R. (2012). «Obstacles to and limitations of social experiments: 15 false alarms». Abt Thought Leadership Paper Series.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  96. ^ a b c Sanson-Fisher RW, Bonevski B, Green LW, D’Este C (2007). «Limitations of the randomized controlled trial in evaluating population-based health interventions». Am J Prev Med. 33 (2): 155–61. doi:10.1016/j.amepre.2007.04.007. PMID 17673104.
  97. ^ a b Johnston SC, Rootenberg JD, Katrak S, Smith WS, Elkins JS (2006). «Effect of a US National Institutes of Health programme of clinical trials on public health and costs» (PDF). Lancet. 367 (9519): 1319–27. doi:10.1016/S0140-6736(06)68578-4. PMID 16631910. S2CID 41035177.
  98. ^ a b Yitschaky O, Yitschaky M, Zadik Y (May 2011). «Case report on trial: Do you, Doctor, swear to tell the truth, the whole truth and nothing but the truth?» (PDF). J Med Case Rep. 5 (1): 179. doi:10.1186/1752-1947-5-179. PMC 3113995. PMID 21569508.
  99. ^ «How Well Do Meta-Analyses Disclose Conflicts of Interests in Underlying Research Studies | The Cochrane Collaboration». Cochrane.org. Retrieved 2011-08-19.
  100. ^ Bekelman JE, Li Y, Gross CP (2003). «Scope and impact of financial conflicts of interest in biomedical research: a systematic review». J Am Med Assoc. 289 (4): 454–65. doi:10.1001/jama.289.4.454. PMID 12533125.
  101. ^ a b Bhandari M, Busse JW, Jackowski D, Montori VM, Schünemann H, Sprague S, Mears D, Schemitsch EH, Heels-Ansdell D, Devereaux PJ (2004). «Association between industry funding and statistically significant pro-industry findings in medical and surgical randomized trials». Can Med Assoc J. 170 (4): 477–80. PMC 332713. PMID 14970094.
  102. ^ Chapman SJ, Shelton B, Mahmood H, Fitzgerald JE, Harrison EM, Bhangu A (2014). «Discontinuation and non-publication of surgical randomised controlled trials: observational study». BMJ. 349: g6870. doi:10.1136/bmj.g6870. PMC 4260649. PMID 25491195.
  103. ^ Ridker PM, Torres J (2006). «Reported outcomes in major cardiovascular clinical trials funded by for-profit and not-for-profit organizations: 2000-2005». JAMA. 295 (19): 2270–4. doi:10.1001/jama.295.19.2270. PMID 16705108.
  104. ^ Song Zhang; Jing Cao; Ahn, C. (23 June 2010). «Calculating sample size in trials using historical controls». Clinical Trials: Journal of the Society for Clinical Trials. 7 (4): 343–353. doi:10.1177/1740774510373629. PMC 3085081. PMID 20573638.
  105. ^ Rowland, D., DiGuiseppi, C., Gross, M., Afolabi, E. and Roberts, I. (2003). «Randomised controlled trial of site specific advice on school travel patterns». Archives of Disease in Childhood. 88 (1): 8–11. doi:10.1136/adc.88.1.8. PMC 1719287. PMID 12495948.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  106. ^ Graham-Rowe, E., Skippon, S., Gardner, B. and Abraham, C. (2011). «Can we reduce car use and, if so, how? A review of available evidence». Transportation Research Part A: Policy and Practice. 44 (5): 401–418. doi:10.1016/j.tra.2011.02.001.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  107. ^ Melia(2011) Do Randomised Control Trials Offer a Solution to ‘low Quality’ Transport Research? Bristol: University of the West of England]
  108. ^ a b Farrington DP, Welsh BC (2005). «Randomized experiments in criminology: What have we learned in the last two decades?». Journal of Experimental Criminology. 1 (1): 9–38. doi:10.1007/s11292-004-6460-0. S2CID 145758503.
  109. ^ Hollin CR (2008). «Evaluating offending behaviour programmes: does only randomization glister?». Criminology and Criminal Justice. 8 (1): 89–106. doi:10.1177/1748895807085871. S2CID 141222135.
  110. ^ Connolly, Paul; Keenan, Ciara; Urbanska, Karolina (2018-07-09). «The trials of evidence-based practice in education: a systematic review of randomised controlled trials in education research 1980–2016». Educational Research. 60 (3): 276–291. doi:10.1080/00131881.2018.1493353. ISSN 0013-1881.
  111. ^ Walker HM, Seeley JR, Small J, Severson HH, Graham BA, Feil EG, Serna L, Golly AM, Forness SR (2009). «A randomized controlled trial of the First Step to Success early intervention. Demonstration of program efficacy outcomes in a diverse, urban school district». Journal of Emotional and Behavioral Disorders. 17 (4): 197–212. doi:10.1177/1063426609341645. S2CID 144571336.
  112. ^ Bradshaw CP, Zmuda JH, Kellam SG, Ialongo NS (2009). «Longitudinal impact of two universal preventive interventions in first grade on educational outcomes in high school». Journal of Educational Psychology. 101 (4): 926–937. doi:10.1037/a0016586. PMC 3678772. PMID 23766545.
  113. ^ Krauss, Alexander (2018). «Why all randomised controlled trials produce biased results». Annals of Medicine. 50 (4): 312–322. doi:10.1080/07853890.2018.1453233. ISSN 0785-3890. PMID 29616838.

External links[edit]

  • Bland M. Directory of randomisation software and services. University of York, 2008 March 19.
  • Evans I, Thornton H, Chalmers I. Testing treatments: better research for better health care. London: Pinter & Martin, 2010. ISBN 978-1-905177-35-6.
  • Gelband H. The impact of randomized clinical trials on health policy and medical practice: background paper. Archived 2016-03-03 at the Wayback Machine Washington, DC: U.S. Congress, Office of Technology Assessment, 1983. (Report OTA-BP-H-22.)
  • REFLECT (Reporting guidElines For randomized controLled trials for livEstoCk and food safeTy) Statement
  • Wathen JK, Cook JD. Power and bias in adaptively randomized clinical trials. M. D. Anderson Cancer Center, University of Texas, 2006 July 12.

Рандомизация в клинических испытаниях

Рандомизация является ключевым понятием анализа медицинских данных.

Термин «рандомизация» относится не к выборке, а к способу ее генерирования.

Говоря, что группа данного размера является простой случайной выборкой из большей группы, мы подразумеваем, что все возможные выборки этого размера извлекаются с равными вероятностями.

Говоря, что обработка назначается объектам случайно, мы подразумеваем, что вероятность назначения каждого вида обработки одинакова для всех объектов.

На необходимость рандомизации впервые указал Р.Фишер [Fisher, 1935].

Рандомизация преследует три цели:

  • гарантирует, что наши предпочтения не повлияют на формирование групп с различными видами обработки

  • предотвращает опасность, связанную с выбором на основе личных суждений

  • наконец, при случайном (рандомизированном) распределении обработок самый строгий критик не сможет сказать, что группы пациентов рассматривались по-разному вследствие наших предпочтений

Рандомизация в клинических испытаниях

Предположим, необходимо провести клинические испытания лекарственного препарата, чтобы установить его эффективность.

Для этого, например, 50 больным назначают лекарство, а другим 50 больным назначают нейтральный препарат («пустышку»),

Предположим еще, что больные поступают на испытания сериями, в течение некоторого времени, а не одновременно.

Рассмотрим два метода рандомизации.

В первом методе требуется выбрать 50 различных чисел между 1 и 100, активное лекарство должно быть назначено тем из 100 больных, чьи номера попали в этот набор. Остальные 50 пациентов будут получать нейтральный препарат.

Этот метод имеет два недостатка. Во-первых, если придется преждевременно завершить исследование, то общее число пациентов, принимавших активный препарат, с большой вероятностью не будет равно числу пациентов, принимавших нейтральный препарат.

Между тем статистические методы сравнения теряют чувствительность, если размеры выборок различаются.

Во-вторых, если клиническое состояние пациентов, включающихся в испытание в один момент времени, отличается от состояния пациентов, включающихся в другой момент, или меняются правила приема препаратов, то, несмотря на рандомизацию, две группы, возможно, будут отличаться по типу пациентов или по правилам приема лекарств (см. [Cutler et al., 1966, p. 865]).

Второй возможный метод рандомизации лишен недостатков, присущих первому.

С помощью этого метода проводится независимая последовательная рандомизация пациентов, поступающих в течение коротких промежутков времени, по группам лечений.

Предположим, что ежемесячно в испытаниях начинают участвовать десять больных.

Разумно случайно назначать пяти пациентам лечение одного вида, а остальным пяти пациентам— другого, повторяя случайное назначение каждый месяц, по мере поступления новых партий больных.

Реализацию этой процедуры можно осуществить, например, с помощью таблицы случайных чисел, сгенерированной в STATISTICA.

Будем вести просмотр по десяти цифрам от 0 до 9, поскольку выбор ведется из 10 больных. Нулем обозначим десятого больного.

Если мы начнем с пятого столбца, то первыми пятью различными цифрами окажутся 2, 5, 4, 8, 6. Значит, из десяти больных второму, пятому, четвертому, восьмому и шестому будет назначен активный, а остальным — нейтральный препарат.

Продолжая просматривать таблицу, увидим, что из следующих десяти больных первый, третий, пятый, восьмой и десятый будут принимать активный, а остальные — нейтральный препарат. Использовав первые цифры в столбце, можно продолжать просмотр по вторым цифрам этого столбца.

Для каждой следующей группы больных следует получать новый набор случайных чисел, чтобы избежать смещений, которые могут появиться вследствие скрытой периодичности типа больных или ввиду того, что сотрудникам клиники вскоре будет ясен вид лекарства (он должен быть неизвестен сотрудникам, контактирующим с пациентами).

Частный случай этого метода — испытания на парах пациентов, когда один из двух пациентов получает активный, а другой — нейтральный препарат.

В этом случае рандомизацию проводить очень просто.

Сначала каким-либо образом, например, по алфавитному порядку фамилий, выделяют одного из двух больных как первого.

Этот выбор надо сделать до проведения рандомизации. Затем, начиная с любого удобного места, просматривают однозначные числа в таблице случайных чисел.

Если цифра нечетная — 1, 3, 5, 7 или 9, то первый больной принимает активный, а второй — нейтральный препарат. Если цифра четная — 0, 2, 4, б или 8, активное лекарство назначают второму больному.

Связанные определения:
Рандомизация
Рандомизированное контролируемое клиническое исследование
Стратификация

В начало

Содержание портала

Рандомизированное контролируемое испытание (рандомизированное контролируемое исследование, РКИ) — это тип научного (часто медицинского) эксперимента, целью которого является уменьшение определенных источников систематической ошибки при проверке эффективности новых методов лечения; это достигается путем случайного распределения субъектов в двух или более группах, различного отношения к ним, а затем сравнения их с измеренным ответом. Одна группа — экспериментальная группа — оценивает вмешательство, в то время как другая — обычно называемая контрольной группой — имеет кардинальное отличие, такое как отсутствие вмешательства или использование плацебо. Группы иследуют в условиях плана исследования, чтобы увидеть, насколько эффективным было экспериментальное вмешательство. Эффективность лечения оценивается в сравнении с контрольной групой. Может быть более одной экспериментальной группы или более одной контрольной группы.

Испытание может быть слепым, в нём информация, которая может повлиять на участников, скрывается до завершения эксперимента. В слепом испытании информацию могут скрывать от любого участника эксперимента, включая субъектов, исследователей, техников, аналитиков данных и оценщиков. Хорошее скрытие может уменьшить или устранить некоторые источники экспериментальной необъективности.

Случайность при распределении субъектов по группам уменьшает системную ошибку отбора и смещение распределения, балансируя как известные, так и неизвестные перемменые (прогностические) факторы при назначении лечения. Слепое испытание уменьшает другие формы смещения экспериментатора и субъекта.

Термины «РКИ» и «рандомизированное исследование» иногда используются как синонимы, но последний термин упускает упоминание о контроле и поэтому может описывать исследования, в которых сравнивают несколько групп лечения друг с другом в отсутствие контрольной группы.

Содержание

  • 1 Классификации

    • 1.1 По дизайну исследования
  • 2 Рандомизация

    • 2.1 Методика проведения

      • 2.1.1 Простое рандомизирование
      • 2.1.2 Ограниченная рандомизация
    • 2.2 Сокрытие распределения
    • 2.3 Размеры выборки
  • 3 Слепой метод
  • 4 История
  • 5 Примечания

Классификации

По дизайну исследования

Одним из способов классификации РКИ является дизайн исследования. От наиболее распространенных в медицинской литературе до самых распространенных категорий, основные категории планов исследования РКИ:

  • Параллельная группа — каждый участник случайным образом назначается группе, и все участники группы получают (или не получают) вмешательство.
  • Кроссовер — со временем каждый участник получает (или не получает) вмешательство в случайной последовательности.
  • Кластер — уже существующие группы участников (например, деревни, школы) выбираются случайным образом для получения (или не получения) вмешательства.
  • Факториал — каждый участник случайным образом распределяется по группе, которая получает определенную комбинацию вмешательств или невмешательств (например, группа 1 получает витамин X и витамин Y, группа 2 получает витамин X и плацебо Y, группа 3 получает плацебо X и витамин Y и группа 4 получает плацебо X и плацебо Y).

Анализ 616 РКИ, проиндексированных в PubMed в декабре 2006 года, показал, что 78% были исследованиями в параллельных группах, 16% были перекрестными, 2% были расщепленными, 2% были кластерными и 2% были факториальными.

Эталонным дизайном клинических исследований являются рандомизированные контролируемые двойные слепые исследования, при которых рандомизация осуществляется тайно, а контрольная группа получает плацебо, не отличимое от исследуемого вмешательства.

Рандомизация

Преимущества правильной рандомизации в РКИ включают в себя:

  • «Это устраняет предвзятость при назначении лечения», в частности, предвзятость выбора и смешение.
  • «Это облегчает ослепление (маскировку) идентичности процедур от исследователей, участников и экспертов».
  • «Это позволяет использовать теорию вероятностей, чтобы выразить вероятность того, что любая разница в результатах между группами лечения просто указывает на шанс».

В рандомизации пациентов к различным вмешательствам участвуют два процесса. Первый — это выбор процедуры рандомизации для генерации непредсказуемой последовательности распределений; это может быть простое случайное распределение пациентов в любой из групп с равными вероятностями, может быть «ограниченным» или может быть «адаптивным». Вторым и более практичным вопросом является сокрытие распределения, которое относится к строгим мерам предосторожности, принятым для обеспечения того, чтобы групповое распределение пациентов не было выявлено до окончательного распределения их по соответствующим группам. Неслучайные «систематические» методы группового назначения, такие как чередование субъектов между одной группой и другой, могут вызвать «безграничные возможности загрязнения» и могут привести к нарушению сокрытия распределения.

Однако эмпирические доказательства того, что адекватная рандомизация меняет результаты относительно неадекватной рандомизации, было трудно обнаружить.

Методика проведения

Идеальная процедура рандомизации позволила бы достичь следующих целей:

  • Максимизировать статистическую мощность, особенно в анализе подгрупп. Как правило, равные размеры групп максимизируют статистическую мощность, однако, неравные размеры групп могут быть более мощными для некоторых анализов (например, многократное сравнение плацебо по сравнению с несколькими дозами с использованием процедуры Даннетта), и иногда желательны по неаналитическим причинам (например, пациенты могут быть более мотивированы к регистрации, если есть больше шансов получить тестовое лечение, или регулирующие органы могут потребовать минимальное количество пациентов, подвергаемых лечению).
  • Минимизировать смещение выбора. Это может произойти, если иследователи могут сознательно или неосознанно отдавать предпочтение пациентам между группами лечения. Хорошая процедура рандомизации будет непредсказуемой, так что иследователи не смогут угадать распределение группы следующего субъекта на основании предыдущих назначений лечения. Риск предвзятости выбора наиболее высок, если известны предыдущие назначения лечения (как в неслепых исследованиях) или можно предположить (возможно, если лекарство имеет характерные побочные эффекты).
  • Минимизировать смещение распределения. Это может происходить, когда переменые, которые влияют на результат, не одинаково распределены между группами лечения, и эффект лечения смешивается с эффектом переменых (то есть, «случайным смещением»). Если процедура рандомизации вызывает дисбаланс в переменых, связанных с исходом по группам, оценки эффекта могут быть смещены, если они не скорректированы для переменых (что может быть неизмеренным и, следовательно, его невозможно скорректировать).

Тем не менее, ни одна процедура рандомизации не отвечает этим целям при любых обстоятельствах, поэтому исследователи должны выбрать процедуру для данного исследования, основываясь на его преимуществах и недостатках.

Простое рандомизирование

Это обычно используемая и интуитивно понятная процедура, похожая на «повторное честное подбрасывание монет». Также известная как «полная» или «неограниченная» рандомизация, она устойчива как к отбору, так и к случайным отклонениям. Тем не менее, её основным недостатком является возможность несбалансированных размеров групп в небольших РКИ. Поэтому она рекомендуется только для РКИ с более чем 200 субъектами.

Ограниченная рандомизация

Чтобы сбалансировать размеры групп в более мелких РКИ, рекомендуется некоторая форма «ограниченной» рандомизации. Основные типы ограниченной рандомизации, используемые в РКИ:

  • Рандомизация блоков с перестановками или блокировка рандомизации: указываются «размер блока» и «коэффициент распределения» (количество субъектов в одной группе по сравнению с другой группой), и субъекты распределяются случайным образом в каждом блоке. Например, размер блока 6 и коэффициент распределения 2: 1 приведет к случайному распределению 4 субъектов в одну группу и 2 в другую. Этот тип рандомизации может сочетаться с «стратифицированной рандомизацией», например, по центру в многоцентровом испытании, чтобы «обеспечить хороший баланс характеристик участников в каждой группе». Частным случаем рандомизации перестановочных блоков является случайное распределение, при котором вся выборка рассматривается как один блок. Основным недостатком рандомизации перестановочных блоков является то, что даже если размеры блоков велики и случайным образом изменяются, процедура может привести к смещению выбора. Другим недостатком является то, что для «правильного» анализа данных от перестановочно рандомизированных блоков РКИ требуется стратификация по блокам.
  • Адаптивные методы рандомизации с предвзятыми монетами (из которых рандомизация урн является наиболее широко известным типом): в этих относительно необычных методах вероятность быть назначенной группе уменьшается, если группа перепредставлена, и увеличивается, если группа недопредставлена. Считается, что эти методы менее подвержены влиянию смещения выбора, чем рандомизация перестановочных блоков.

Сокрытие распределения

Сокрытие распределения (определяемое как «процедура защиты процесса рандомизации таким образом, чтобы назначаемое лечение не было известно до того, как пациент был включен в исследование»), является важным в РКИ. На практике клинические исследователи в РКИ часто испытывают трудности в поддержании беспристрастности. Существует множество историй о том, что следователи держат запечатанные конверты у фонарей или обыскивают офисы, чтобы определить групповые задания, чтобы диктовать назначение их следующему пациенту. Такая практика привносит предвзятость выбора и факторы, которые мешают рандомизации, что может привести к искажению результатов исследования. Надлежащее сокрытие распределения должно побудить пациентов и исследователей к определению распределения лечения после начала исследования и после его завершения. Связанные с лечением побочные эффекты или неблагоприятные события могут быть достаточно конкретными, чтобы выявить распределение среди исследователей или пациентов, тем самым внося систематическую ошибку или влияя на любые субъективные параметры, собранные исследователями или запрошенные у субъектов.

Некоторые стандартные методы обеспечения сокрытия выделяют включение последовательно пронумерованные, непрозрачные, запечатанные конверты; последовательно пронумерованные контейнеры; контролируемая фармацевтикой рандомизация; и центральная рандомизация. Рекомендуется, чтобы методы маскирования распределения были включены в протокол РКИ, и чтобы методы маскирования распределения были подробно представлены в публикации результатов РКИ; однако, исследование 2005 года установило, что у большинства РКИ скрыта маскировка распределения в их протоколах, или в их публикациях или в обоих. С другой стороны, исследование 146 метаанализов, проведенное в 2008 году, пришло к выводу, что результаты РКИ с неадекватным или нечетким сокрытием распределения имели тенденцию быть склонными к положительным эффектам, только если результаты РКИ были субъективными, а не объективными.

Размеры выборки

Количество лечебных груп (субъектов или групп субъектов), назначенных контрольной и лечебной группам, влияет на надежность РКИ. Если эффект от лечения невелик, количество единиц лечения в любой группе может оказаться недостаточным для отклонения нулевой гипотезы в соответствующем статистическом тесте. Неспособность отвергнуть нулевую гипотезу будет означать, что лечение не показывает статистически значимого результата на экспериментальной групе в данном тесте. Но по мере увеличения размера выборки тот же РКИ может продемонстрировать значительный эффект лечения, даже если этот эффект мал.

Слепой метод

РКИ могут быть ослеплены (также называемыми «маскированными») «процедурами, которые не позволяют участникам исследования, лицам, осуществляющим уход, или оценщикам узнать, какое вмешательство было получено». В отличие от сокрытия распределения, ослепление иногда неуместно или невозможно выполнить в РКИ; например, если РКИ включает лечение, в котором необходимо активное участие пациента (например, физиотерапия), от участника не возможно скрыть вмешательство.

Традиционно слепые рандомизированные клинические испытания классифицируются как «одиночные слепые», «двойные слепые» или «тройные слепые»; однако в 2001 и 2006 годах два исследования показали, что эти термины имеют разные значения для разных людей. В Заявлении CONSORT (Consolidated Standards of Reporting Trials) 2010 года указывается, что авторам и редакторам не следует использовать термины «одиночный слепой», «двойной слепой» и «тройной слепой»; вместо этого в отчетах о слепом РКИ следует обсудить «Если это будет сделано, кто был ослеплен после назначения на вмешательства (например, участники, поставщики медицинских услуг, те, кто оценивает результаты) и как.»

История

Рандомизированные контролируемые испытания проводятся с середины XX века. Они являются основой доказательной медицины. При анализе результатов РКИ используются статистические методы, определяющие научную обоснованность получаемых выводов. РКИ наиболее оптимально для оценки эффективности лечения и имеет низкую вероятность возникновения систематической ошибки. Недостатками РКИ являются сложность осуществления и невозможность распространения результатов на некоторые популяции.

Блок-схема четырех фаз (включение, распределение, вмешательство, последующее наблюдение и анализ данных) параллельного рандомизированного исследования из двух группы (в контролируемом исследовании одно из вмешательств служит в качестве контроля), измененное на основе CONSORT (Consolidated Standards of Reporting Trials) 2010 Statement

A рандомизированное контролируемое исследование (или рандомизированное контрольное исследование ; РКИ ) — это тип научного (часто медицинского) эксперимента, направленного на уменьшение определенных источников предвзятости при проверке эффективности новых методов лечения; это достигается путем случайного распределения субъектов по двум или более группам, лечения их по-разному и последующего сравнения их с измеренным ответом. Одна группа — экспериментальная группа — получает оцениваемое вмешательство, а другая — обычно называемая контрольной группой — получает альтернативное лечение, такое как плацебо или отсутствие вмешательства. Группы отслеживаются в условиях дизайна исследования, чтобы определить эффективность экспериментального вмешательства, и эффективность оценивается по сравнению с контролем. Может быть более одной группы лечения или более одной контрольной группы.

Испытание может быть слепым, что означает, что информация, которая может повлиять на участников, утаивается до завершения эксперимента. Слепой может быть подвергнут любой участник эксперимента, включая субъектов, исследователей, технических специалистов, аналитиков данных и оценщиков. Эффективное ослепление может уменьшить или устранить некоторые источники экспериментальной систематической ошибки.

Случайность в распределении субъектов по группам снижает систематическую ошибку выбора и систематическую ошибку распределения, уравновешивая как известные, так и неизвестные прогностические факторы в распределении. процедур. Ослепление снижает другие формы предвзятости экспериментатора и испытуемого.

РКИ с хорошей слепотой часто считается золотым стандартом для клинических испытаний. Слепые РКИ обычно используются для проверки эффективности медицинских вмешательств и могут дополнительно предоставить информацию о побочных эффектах, таких как реакции на лекарства.

Термины «РКИ» и « рандомизированное исследование «иногда используется как синоним, но последний термин не упоминает контроль и, следовательно, может описывать исследования, которые сравнивают несколько групп лечения друг с другом в отсутствие контрольной группы. Точно так же инициализм иногда расширяется до «рандомизированное клиническое испытание » или «рандомизированное сравнительное испытание », что приводит к двусмысленности в научной литературе. Не все рандомизированные клинические испытания являются рандомизированными контролируемыми испытаниями (а некоторые из них никогда не могут быть таковыми, как в случаях, когда проведение контроля было бы непрактичным или неэтичным). Термин рандомизированное контролируемое клиническое исследование является альтернативным термином, используемым в клинических исследованиях ; однако рандомизированные контролируемые исследования также используются в других областях исследований, включая многие из социальных наук.

Содержание

  • 1 История
  • 2 Этика
    • 2.1 Регистрация исследования
  • 3 Классификации
    • 3.1 Автор Дизайн исследования
    • 3.2 По интересующему результату (эффективность по сравнению с эффективностью)
    • 3.3 По гипотезе (превосходство по сравнению с не меньшей эффективностью по сравнению с эквивалентностью)
  • 4 Рандомизация
    • 4.1 Процедуры
      • 4.1.1 Простой
      • 4.1.2 Ограниченный
      • 4.1.3 Адаптивный
    • 4.2 Сокрытие распределения
    • 4.3 Размер выборки
  • 5 Ослепление
  • 6 Анализ данных
  • 7 Отчетность о результатах
    • 7.1 Относительная важность и обсервационные исследования
    • 7.2 Интерпретация статистических результатов
    • 7.3 Экспертная оценка
  • 8 Преимущества
  • 9 Недостатки
    • 9.1 Время и затраты
    • 9.2 Опасности конфликта интересов
    • 9.3 Этика
  • 10 В социальных науках
    • 10.1 Транспортные науки
    • 10.2 Международное развитие
    • 10.3 Криминология
    • 10.4 Образование
  • 11 Критика
  • 12 См. Также
  • 13 Ссылки
  • 14 Дополнительная литература
  • 15 Exte ные ссылки

История

Первое зарегистрированное клиническое испытание было проведено Джеймсом Линдом в 1747 году для определения метода лечения цинги. Рандомизированные эксперименты появились в психологии, где они были введены Чарльзом Сандерсом Пирсом и Джозефом Джастроу в 1880-х годах, а также в образовании. Позже, в начале 20 века, рандомизированные эксперименты появились в сельском хозяйстве благодаря Ежи Нейману и Рональду А. Фишеру. Экспериментальные исследования Фишера и его работы популяризировали рандомизированные эксперименты.

Первое опубликованное РКИ в медицине появилось в статье 1948 года под названием «Стрептомицин лечение легочного туберкулеза », в которой описывалось расследование Совета медицинских исследований. Одним из авторов этой статьи был Остин Брэдфорд Хилл, который, как считается, задумал современное РКИ.

К концу 20 века РКИ были признаны стандартным методом «рационального терапия »в медицине. По состоянию на 2004 г. в Кокрановской библиотеке находилось более 150 000 РКИ. Чтобы улучшить освещение РКИ в медицинской литературе, международная группа ученых и редакторов опубликовала Сводные стандарты отчетности (CONSORT) Заявления в 1996, 2001 и 2010 годах, и они получили широкое признание. Рандомизация — это процесс распределения субъектов исследования в группы лечения или контрольные группы с использованием элемента случайности для определения назначений с целью уменьшения систематической ошибки.

Этика

Хотя принцип клинического равновесия («подлинная неуверенность в экспертном медицинском сообществе… в отношении предпочтительного лечения»), общий для клинических испытаний, был применен по отношению к РКИ этика РКИ требует особого внимания. С одной стороны, утверждалось, что самого уравновешивания недостаточно для оправдания РКИ. С другой стороны, «коллективное уравновешивание» может вступать в конфликт с отсутствием личного уравновешивания (например, личной верой в эффективность вмешательства). Наконец, дизайн Зелена, который использовался в некоторых РКИ, рандомизирует субъектов до того, как они предоставят информированное согласие, что может быть этичным для РКИ скрининга и выбранных методов лечения, но, вероятно, неэтично » для большинства терапевтических испытаний ».

Хотя субъекты почти всегда предоставляют информированное согласие на свое участие в РКИ, исследования с 1982 года документально подтвердили, что субъекты РКИ могут полагать, что они обязательно получат лечение, которое лучше для них лично; то есть они не понимают разницы между исследованием и лечением. Необходимы дальнейшие исследования для определения распространенности и способов устранения этого «терапевтического заблуждения «.

Варианты метода РКИ могут также создавать культурные эффекты, которые не были хорошо изучены. Например, пациенты с неизлечимыми заболеваниями могут присоединиться к испытаниям в надежда на выздоровление, даже если лечение вряд ли будет успешным.

Регистрация исследования

В 2004 году Международный комитет редакторов медицинских журналов (ICMJE) объявил, что Все испытания, включенные в набор после 1 июля 2005 г., должны быть зарегистрированы до рассмотрения для публикации в одном из 12 журналов-членов комитета. Однако регистрация испытания может происходить поздно или вообще не регистрироваться. Медицинские журналы медленно адаптируют политику, требующую обязательная регистрация клинических испытаний как предварительное условие для публикации.

Классификации

По дизайну исследования

Один из способов классификации РКИ — дизайн исследования. Из большинства наименее распространенный в медицине В литературе основными категориями дизайнов РКИ исследований являются:

  • Параллельная группа — каждый участник случайным образом распределяется в группу, и все участники в группе получают (или не получают) вмешательство.
  • Кроссовер — со временем каждый участник получает (или не получает) вмешательство в случайной последовательности.
  • Кластер — ранее существующие группы участников (например, деревни, школы) выбираются случайным образом для получать (или не получать) вмешательство.
  • Фактор — каждый участник случайным образом попадает в группу, которая получает определенную комбинацию вмешательств или невмешательств (например, группа 1 получает витамин X и витамин Y, группа 2 получает витамин X и плацебо Y, группа 3 получает плацебо X и витамин Y, а группа 4 получает плацебо X и плацебо Y).

Анализ 616 РКИ, проиндексированных в PubMed в декабре 2006 года, показал, что 78% были исследованиями в параллельных группах, 16% были перекрестными, 2% были разделенными, 2% были кластерными и 2% были клиническими. факториал.

По интересующему результату (эффективность по сравнению с эффективностью)

РКИ можно классифицировать как «объясняющие» или «прагматические». Пояснительные РКИ проверяют эффективность в условиях исследования с тщательно отобранными участниками и в строго контролируемых условиях. Напротив, прагматические РКИ (pRCT) проверяют эффективность в повседневной практике с относительно невыбранными участниками и в гибких условиях; таким образом, прагматические РКИ могут «информировать о решениях, касающихся практики».

По гипотезе (превосходство против не меньшей эффективности против эквивалентности)

Другая классификация РКИ классифицирует их как «испытания превосходства» », «испытания на неэффективность» и «испытания на эквивалентность», которые различаются по методологии и отчетности. Большинство РКИ являются исследованиями превосходства, в которых предполагается, что одно вмешательство превосходит другое в статистически значимой степени. Некоторые РКИ являются исследованиями не меньшей эффективности, «чтобы определить, не хуже ли новое лечение, чем эталонное». Другие РКИ представляют собой исследования эквивалентности, в которых гипотеза состоит в том, что два вмешательства неотличимы друг от друга.

Рандомизация

Преимущества правильной рандомизации в РКИ включают:

  • «Это устраняет предвзятость при назначении лечения», в частности, предвзятость выбора и искажение.
  • «Это облегчает скрытие (маскировку) идентичности лечения от исследователей, участников и экспертов»
  • .

  • «Это позволяет использовать теорию вероятности для выражения вероятности того, что любая разница в результатах между группами лечения просто указывает на шанс».

Существует два процесса, участвующих в рандомизации пациентов для различных вмешательств. Во-первых, это выбор процедуры рандомизации для генерации непредсказуемой последовательности распределений; это может быть простое случайное распределение пациентов в любую из групп с равной вероятностью, может быть «ограниченным» или может быть «адаптивным». Второй и более практический вопрос — это сокрытие распределения, которое относится к строгим мерам предосторожности, принятым для обеспечения того, чтобы групповое распределение пациентов не было раскрыто до окончательного распределения их по соответствующим группам. Неслучайные «систематические» методы группового распределения, такие как чередование субъектов между одной группой и другой, могут вызвать «безграничные возможности заражения» и могут вызвать нарушение сокрытия распределения.

Однако эмпирические доказательства адекватной рандомизации изменение исходов по сравнению с неадекватной рандомизацией было трудно обнаружить.

Процедуры

Распределение лечения — это желаемая доля пациентов в каждой группе лечения.

Идеальная процедура рандомизации должна достичь следующих целей:

  • Максимизировать статистическую мощность, особенно в анализах подгрупп. Как правило, равные размеры групп максимизируют статистическую мощность, однако неравные размеры групп могут быть более важными для некоторых анализов (например, множественное сравнение плацебо с несколькими дозами с использованием процедуры Даннета) и иногда желательны по неаналитическим причинам (например, пациенты могут более мотивированы для включения, если есть более высокие шансы получить тестовое лечение, или регулирующие органы могут потребовать минимальное количество пациентов, прошедших лечение).
  • Минимизировать систематическую ошибку отбора . Это может произойти, если исследователи могут сознательно или неосознанно включать пациентов между группами лечения. Хорошая процедура рандомизации будет непредсказуемой, так что исследователи не смогут угадать назначение следующей группы испытуемого на основе предыдущих назначений лечения. Риск смещения выбора наиболее высок, когда предыдущие назначения лечения известны (как в неслепых исследованиях) или могут быть угаданы (возможно, если лекарство имеет характерные побочные эффекты).
  • Минимизировать смещение распределения (или искажающее ). Это может произойти, когда ковариаты, которые влияют на результат, неравномерно распределены между группами лечения, и эффект лечения смешан с эффектом ковариат (т.е. «случайная систематическая ошибка»). Если процедура рандомизации вызывает дисбаланс ковариат, связанных с результатом по группам, оценки эффекта могут быть смещены, если не скорректированы на ковариаты (которые могут быть неизмеримыми и, следовательно, невозможно скорректировать).

Однако ни одна процедура рандомизации не отвечает этим целям в любых обстоятельствах, поэтому исследователи должны выбирать процедуру для данного исследования, исходя из ее преимуществ и недостатков.

Простая

Это обычно используемая и интуитивно понятная процедура, похожая на «многократное подбрасывание монеты». Также известная как «полная» или «неограниченная» рандомизация, она устойчива как к отбору, так и к случайным смещениям. Однако его основным недостатком является возможность несбалансированного размера групп в небольших РКИ. Поэтому он рекомендуется только для РКИ с участием более 200 субъектов.

Ограниченный

Чтобы сбалансировать размеры групп в меньших РКИ, рекомендуется некоторая форма «ограниченной» рандомизации. Основными типами ограниченной рандомизации, используемыми в РКИ, являются:

  • рандомизация с перестановкой блоков или блокированная рандомизация : «размер блока» и «коэффициент распределения» (количество субъектов в одном группа по сравнению с другой группой), и субъекты распределяются случайным образом в каждом блоке. Например, размер блока 6 и коэффициент распределения 2: 1 приведет к случайному распределению 4 субъектов в одну группу и 2 — в другую. Этот тип рандомизации можно комбинировать с «стратифицированной рандомизацией », например, по центрам в многоцентровом исследовании, чтобы «обеспечить хороший баланс характеристик участников в каждой группе». Особым случаем рандомизации переставленных блоков является случайное распределение, при котором вся выборка рассматривается как один блок. Основным недостатком рандомизации с перестановками блоков является то, что даже если размеры блоков велики и варьируются случайным образом, процедура может привести к смещению выбора. Другой недостаток заключается в том, что для «правильного» анализа данных рандомизированных РКИ с перестановкой блоков требуется стратификация по блокам.
  • Адаптивная рандомизация на основе предвзятости методы (из которых рандомизация урны является наиболее широко известным type): в этих относительно необычных методах вероятность быть отнесена к группе уменьшается, если группа чрезмерно представлена, и увеличивается, если группа недопредставлена. Считается, что на эти методы в меньшей степени влияет систематическая ошибка выбора, чем на рандомизацию с перестановкой блоков.

Адаптивная

В РКИ использовались как минимум два типа «адаптивных» процедур рандомизации, но гораздо реже, чем простые или ограниченная рандомизация:

  • ковариативно-адаптивная рандомизация, из которых один тип — минимизация : вероятность быть назначенной группе варьируется, чтобы минимизировать ковариантный дисбаланс. » Сообщается, что у минимизации есть «сторонники и недоброжелатели», потому что на самом деле случайным образом выбирается только первая группа субъектов, метод не обязательно устраняет предвзятость по неизвестным факторам.
  • Адаптивная к ответу рандомизация, также известная как адаптивная к исходу рандомизация : вероятность быть отнесенной к группе увеличивается, если ответы предыдущих пациентов в группе были благоприятными. Хотя были высказаны аргументы в пользу того, что этот подход более этичен, чем другие типы рандомизации, когда вероятность того, что лечение является эффективным или неэффективным, увеличивается в ходе РКИ, специалисты по этике еще не изучили этот подход подробно.

Сокрытие распределения

«Сокрытие распределения» (определяемое как «процедура защиты процесса рандомизации, чтобы назначенное лечение не было известно до включения пациента в исследование») важно в РКИ. На практике клиническим исследователям в РКИ часто бывает сложно сохранять беспристрастность. Существует множество историй о следователях, которые подносили запечатанные конверты к свету или обыскивали офисы, чтобы определить групповые задания, чтобы продиктовать назначение следующего пациента. Такая практика привносит систематическую ошибку отбора и искажающие факторы (и то, и другое следует минимизировать с помощью рандомизации), что может исказить результаты исследования. Адекватное сокрытие распределения должно помешать пациентам и исследователям обнаружить распределение лечения после того, как исследование началось и после его завершения. Связанные с лечением побочные эффекты или нежелательные явления могут быть достаточно специфичными, чтобы их можно было отнести к исследователям или пациентам, тем самым создавая систематическую ошибку или влияя на любые субъективные параметры, собранные исследователями или запрошенные у субъектов.

Некоторые стандартные методы обеспечения сокрытия распределения включают последовательно пронумерованные непрозрачные запечатанные конверты (SNOSE); последовательно пронумерованные контейнеры; аптечная контролируемая рандомизация; и централизованная рандомизация. Рекомендуется, чтобы методы сокрытия распределения были включены в протокол RCT, а методы сокрытия распределения должны быть подробно описаны в публикации результатов RCT; тем не менее, исследование 2005 года показало, что большинство РКИ имеют нечеткое сокрытие распределения в своих протоколах, в своих публикациях или в обоих. С другой стороны, исследование 146 метаанализов 2008 г. пришло к выводу, что результаты РКИ с неадекватным или нечетким сокрытием распределения имели тенденцию быть смещенными в сторону положительных эффектов только в том случае, если результаты РКИ были субъективными в отличие от цели.

Размер выборки

Количество лечебных единиц (субъектов или групп субъектов), назначенных для контрольной и лечебной групп, влияет на надежность РКИ. Если эффект лечения невелик, количество лечебных единиц в любой группе может быть недостаточным для отклонения нулевой гипотезы в соответствующем статистическом тесте. Неспособность отвергнуть нулевую гипотезу будет означать, что лечение не оказывает статистически значимого влияния на лечение в данном тесте. Но по мере увеличения размера выборки одно и то же РКИ может продемонстрировать значительный эффект лечения, даже если этот эффект невелик.

Ослепление

РКИ может быть слепым. (также называемый «замаскированным») посредством «процедур, которые не позволяют участникам исследования, лицам, осуществляющим уход, или специалистам по оценке результатов узнать, какое вмешательство было проведено». В отличие от сокрытия распределения, ослепление иногда неуместно или невозможно выполнить в РКИ; например, если РКИ включает лечение, в котором необходимо активное участие пациента (например, физиотерапия ), участники не могут быть скрыты от вмешательства.

Традиционно слепые РКИ классифицируются как «одинарные слепые», «двойные слепые» или «тройные слепые»; однако в 2001 и 2006 годах два исследования показали, что эти термины имеют разное значение для разных людей. В заявлении CONSORT от 2010 г. указывается, что авторы и редакторы не должны использовать термины «одинарный слепой», «двойной слепой» и «тройной слепой»; вместо этого в отчетах о слепых РКИ следует обсуждать: «Если это было сделано, кто был слепым после назначения вмешательств (например, участники, поставщики медицинских услуг, те, кто оценивал результаты) и как».

РКИ без слепого исследования называются « неслепой »,« открытый »или (если вмешательство — это лекарство)« открытое ». В 2008 году исследование пришло к выводу, что результаты неслепых РКИ имели тенденцию иметь тенденцию к положительному эффекту только в том случае, если результаты РКИ были субъективными, а не объективными; например, в РКИ по лечению рассеянного склероза неслепые неврологи (но не слепые неврологи) сочли, что лечение было полезным. В прагматических РКИ, хотя участники и поставщики часто не ослеплены, «все же желательно и часто возможно ослепить эксперта или получить объективный источник данных для оценки результатов».

Анализ данных

Типы статистических методов, используемых в РКИ, зависят от характеристик данных и включают:

  • для дихотомических (бинарных) данных результатов, логистической регрессии (например, для прогнозировать устойчивый вирусологический ответ после приема пегинтерферона альфа-2a для гепатита C ), и могут использоваться другие методы.
  • Для непрерывных данных результатов анализ ковариация (например, для изменений уровня липидов в крови после приема аторвастатина после острого коронарного синдрома ) проверяет влияние переменных-предикторов.
  • Для времени- данные о результатах события, которые могут быть подвергнуты цензуре, анализ выживаемости (например, оценки Каплана-Мейера и модели пропорциональных рисков Кокса для t Время до ишемической болезни сердца после получения заместительной гормональной терапии в период менопаузы ) является приемлемым.

Независимо от используемых статистических методов, важные соображения при анализе данных РКИ включают:

  • Следует ли преждевременно прекратить РКИ из-за промежуточных результатов. Например, рандомизированные контролируемые испытания могут быть прекращены раньше, если вмешательство приносит «большую, чем ожидалось, пользу или вред», или если «исследователи не обнаруживают существенных различий между экспериментальными и контрольными вмешательствами».
  • Степень, в которой группы могут быть проанализированы точно так же, как они существовали при рандомизации (т. е. используется ли так называемый «анализ намерения лечить »). «Чистый» анализ намерения лечить «возможен только при наличии полных данных об исходах» для всех рандомизированных субъектов; когда некоторые данные о результатах отсутствуют, варианты включают анализ только случаев с известными исходами и использование условно рассчитанных данных. Тем не менее, чем больше в анализ могут быть включены все участники групп, в которые они были рандомизированы, тем меньше будет систематической ошибки, которой будет подвержено РКИ.
  • Следует ли проводить анализ подгрупп. Они «часто не приветствуются», потому что множественные сравнения могут давать ложноположительные результаты, которые не могут быть подтверждены другими исследованиями.

Отчетность о результатах

Заявление CONSORT 2010 представляет собой «минимальный набор рекомендаций по составлению отчетов о РКИ, основанный на фактических данных». Контрольный список CONSORT 2010 содержит 25 пунктов (многие с подпунктами), посвященных «индивидуально рандомизированным, двухгрупповым, параллельным испытаниям», которые являются наиболее распространенным типом РКИ.

Для других дизайнов РКИ »Расширения CONSORT «были опубликованы, некоторые примеры:

  • Заявление Consort 2010: Расширение на кластерные рандомизированные исследования
  • Заявление Consort 2010: Вмешательства немедикаментозного лечения

Относительная важность и обсервационные исследования

Два исследования, опубликованные в The New England Journal of Medicine в 2000 году, показали, что обсервационные исследования и РКИ в целом дали аналогичные результаты. Авторы результатов 2000 г. подвергли сомнению веру в то, что «обсервационные исследования не следует использовать для определения доказательной медицинской помощи» и что результаты РКИ являются «свидетельством высшей степени». Однако в исследовании 2001 г., опубликованном в Журнале Американской Медицинской Ассоциации, сделан вывод, что «неслучайные несоответствия действительно имеют место и различия в оценочной величине лечебного эффекта очень распространены» между наблюдательными исследованиями и РКИ

<148.>Два других направления рассуждений ставят под вопрос вклад РКИ в научные знания помимо других типов исследований:

  • Если дизайн исследований ранжируется по их потенциалу для новых открытий, то неофициальные данные будут в верхней части списка. список, за которым следуют обсервационные исследования, за которыми следуют РКИ.
  • РКИ могут быть ненужными для лечения, которое имеет драматический и быстрый эффект по сравнению с ожидаемым стабильным или прогрессивно ухудшающимся естественным течением излеченного состояния. Одним из примеров является комбинированная химиотерапия, включающая цисплатин для метастатического рака яичка, которая увеличила показатель излечения с 5% до 60% в 1977 г. нерандомизированное исследование.

Интерпретация статистических результатов

Как и все статистические методы, РКИ подвержены статистическим ошибкам типа I («ложноположительные») и типа II («ложноотрицательные»). Что касается ошибок типа I, в типичном РКИ будет использоваться 0,05 (то есть 1 из 20) как вероятность того, что РКИ ошибочно обнаружит, что два одинаково эффективных лечения значительно различаются. Что касается ошибок типа II, то, несмотря на публикацию в 1978 году статьи, в которой отмечалось, что размеры выборки многих «отрицательных» РКИ были слишком малы, чтобы сделать окончательные выводы об отрицательных результатах, к 2005-2006 гг. Значительная часть РКИ все еще были неточные или неполные расчеты размера выборки.

Экспертная оценка

Экспертная оценка результатов — важная часть научного метода. Рецензенты исследуют результаты исследования на предмет потенциальных проблем с дизайном, которые могут привести к ненадежным результатам (например, путем создания систематической ошибки ), оценивают исследование в контексте связанных исследований и других данных, а также оценивают, насколько исследование можно с полным основанием считать доказавшим его выводы. Чтобы подчеркнуть необходимость коллегиального обзора и опасность чрезмерного обобщения выводов, два медицинских исследователя из Бостона провели рандомизированное контролируемое испытание, в котором они случайным образом назначили либо парашют, либо пустой рюкзак 23 добровольцам, которые прыгнули либо с биплана, либо с самолета. вертолет. Исследование смогло точно сообщить, что парашюты не уменьшают травм по сравнению с пустыми рюкзаками. Ключевой контекст, ограничивавший общую применимость этого вывода, заключался в том, что самолет был припаркован на земле, а участники прыгнули всего на два фута.

Преимущества

RCT считаются наиболее эффективными. надежная форма научных доказательств в иерархии доказательств, которая влияет на политику и практику здравоохранения, поскольку рандомизированные контролируемые исследования снижают ложную причинно-следственную связь и систематическую ошибку. Результаты РКИ могут быть объединены в систематические обзоры, которые все чаще используются в практике, основанной на фактах. Некоторые примеры научных организаций, считающих рандомизированные контролируемые испытания или систематические обзоры рандомизированных контролируемых испытаний наиболее качественными доступными доказательствами:

  • В 1998 г. Национальный совет по здравоохранению и медицинским исследованиям Австралии присвоил статус «Уровень I» доказательство как то, что «получено из систематического обзора всех соответствующих рандомизированных контролируемых испытаний» и доказательство «Уровня II» как то, что «получено по крайней мере в одном правильно спланированном рандомизированном контролируемом исследовании».
  • Поскольку по крайней мере, в 2001 году, давая рекомендации по клинической практике, Целевая группа по профилактическим услугам США рассматривала как дизайн исследования, так и его внутреннюю валидность как показатели его качества.. Он признал «доказательства, полученные по крайней мере из одного должным образом рандомизированного контролируемого исследования» с хорошей внутренней валидностью (т. Е. С оценкой «I-хорошо»), как доказательства самого высокого качества, доступные ему.
  • Рабочая группа GRADE в 2008 году пришла к выводу, что «рандомизированные исследования без важных ограничений представляют собой доказательства высокого качества».
  • По вопросам, связанным с «терапией / профилактикой, этиологией / вредом», Оксфордский центр доказательной медицины по состоянию на 2011 г. определил доказательства «Уровня 1а» как систематический обзор РКИ, которые согласуются друг с другом, а доказательства «Уровня 1b» — как «отдельные РКИ (с узким Доверительный интервал ). »

Известные РКИ с неожиданными результатами, которые способствовали изменениям в клинической практике, включают:

  • После утверждения Управлением по санитарному надзору за качеством пищевых продуктов и медикаментов, антиаритмические агенты флекаинид и энкаинид поступили на рынок в 1986 и 1987 годах соответственно. Нерандомизированные исследования лекарств были охарактеризованы как «блестящие», и их продажи выросли в общей сложности примерно до 165 000 рецептов в месяц в начале 1989 года. Однако в том году предварительный отчет рандомизированного контролируемого исследования показал, что эти два препарата повышенная смертность. Затем продажи лекарств снизились.
  • До 2002 года, основываясь на наблюдательных исследованиях, врачи обычно назначали заместительную гормональную терапию женщинам в постменопаузе для предотвращения инфаркта миокарда. Однако в 2002 и 2004 годах в опубликованных РКИ Инициативы по охране здоровья женщин утверждалось, что у женщин, принимающих заместительную гормональную терапию эстрогеном и прогестином, частота инфарктов миокарда выше, чем у женщин, принимающих плацебо, и что гормон, содержащий только эстроген. Заместительная терапия не вызвала снижения заболеваемости ишемической болезнью сердца. Возможные объяснения расхождений между обсервационными исследованиями и рандомизированными контролируемыми испытаниями заключались в различиях в методологии, используемых схемах гормонов и исследуемых популяциях. После публикации РКИ использование заместительной гормональной терапии снизилось.

Недостатки

Во многих статьях обсуждаются недостатки РКИ. Среди наиболее часто упоминаемых недостатков:

Время и затраты

РКИ могут быть дорогими; в одном исследовании было обнаружено 28 РКИ фазы III, финансируемых Национальным институтом неврологических расстройств и инсульта до 2000 г., с общей стоимостью 335 млн долларов США для среднего стоимость 12 миллионов долларов США на одно РКИ. Тем не менее, рентабельность инвестиций РКИ может быть высокой, поскольку в том же исследовании прогнозировалось, что 28 РКИ принесли «чистую пользу для общества за 10 лет», в 46 раз превышающую затраты на программу исследований. основан на оценке года жизни с поправкой на качество как равного преобладающему среднему значению на душу населения валовой внутренний продукт.

До публикации РКИ требуется несколько лет; таким образом, данные ограничены медицинским сообществом в течение долгих лет и могут быть менее актуальными на момент публикации.

Поддерживать РКИ в течение многих лет или десятилетий, которые были бы идеальными для оценки некоторых вмешательств, обходится дорого. 6>

Вмешательства для предотвращения событий, которые происходят нечасто (например, синдром внезапной детской смерти ) и необычных неблагоприятных исходов (например, редкий побочный эффект лекарства), потребуют РКИ с чрезвычайно большими размерами выборки и поэтому их лучше всего оценивать с помощью обсервационных исследований.

Из-за затрат на проведение РКИ обычно проверяют только одну переменную или очень мало переменных, что редко отражает полную картину сложной медицинской ситуации; в то время как отчет о болезни, например, может подробно описывать многие аспекты медицинской ситуации пациента (например, история болезни, физический осмотр, диагноз, психосоциальные аспекты, последующие действия).

опасность конфликта интересов

Исследование 2011 года, проведенное с целью выявления возможных конфликтов интересов в основных исследованиях, используемых для медицинских метаанализов, проанализировано 29 метаанализов и обнаружено, что конфликты интересов в исследованиях, лежащих в основе метаанализов, раскрываются редко. 29 метаанализов включали 11 из журналов общей медицины; 15 из специализированных медицинских журналов и 3 из Кокрановской Базы данных систематических обзоров. 29 метаанализов проанализировали совокупность 509 рандомизированных контролируемых испытаний (РКИ). Из них 318 РКИ сообщили об источниках финансирования, при этом 219 (69%) профинансированы отраслью. 132 из 509 РКИ сообщили о раскрытии информации о конфликте интересов авторов, при этом 91 исследование (69%) раскрыло финансовые связи отрасли с одним или несколькими авторами. Информация, однако, редко отражалась в метаанализах. Только два (7%) сообщили об источниках финансирования РКИ, и ни один не сообщил о связях между авторами РКИ и отраслью. Авторы пришли к выводу, что «без признания ИСП из-за финансирования отрасли или финансовых связей автора с отраслью из РКИ, включенных в метаанализ, понимание читателями и оценка свидетельств из метаанализа может быть скомпрометировано».

Некоторые РКИ полностью или частично финансируются отраслью здравоохранения (например, фармацевтической отраслью ), а не государственными, некоммерческими или другими источниками. В систематическом обзоре, опубликованном в 2003 г., были обнаружены четыре статьи 1986–2002 гг., В которых сравнивались РКИ, спонсируемые и не спонсируемыми отраслью, и во всех статьях прослеживалась корреляция между спонсорством отрасли и положительными результатами исследования. Исследование 2004–2001 РКИ, опубликованное в ведущих медицинских и хирургических журналах, показало, что РКИ, финансируемые отраслью, «с большей вероятностью будут связаны со статистически значимыми про-отраслевыми результатами». Эти результаты были отражены в испытаниях в хирургии, где, хотя промышленное финансирование не повлияло на частоту прекращения испытаний, оно, однако, было связано с более низкими шансами публикации для завершенных испытаний. Одной из возможных причин про-отраслевых результатов опубликованных РКИ является предвзятость публикации. Другие авторы указали, что разные цели научных исследований и исследований, спонсируемых промышленностью, способствуют разнице. Коммерческие спонсоры могут быть более сосредоточены на проведении испытаний лекарств, которые уже показали себя многообещающими на ранних стадиях испытаний, и на воспроизведении предыдущих положительных результатов для выполнения нормативных требований для утверждения лекарств.

Этика

Если подрывные инновации в медицинских технологиях могут быть трудны с этической точки зрения в РКИ, если станет «очевидным», что контрольные субъекты имеют худшие результаты — либо из-за других вышеупомянутых тестов, либо в рамках первоначального фаза самого РКИ. С этической точки зрения может возникнуть необходимость преждевременно прервать рандомизированное контролируемое исследование, и получение этического одобрения (и согласия пациента) на отказ от нововведения в контрольной группе в будущих рандомизированных контролируемых исследованиях может оказаться невозможным.

Исторические контрольные испытания (HCT) используют данные предыдущих РКИ для уменьшения размера выборки; однако эти подходы неоднозначны в научном сообществе и требуют осторожного обращения.

В социальных науках

В связи с недавним появлением РКИ в социальных науках, их использование в социальных науках является спорным вопросом. Некоторые авторы, работающие в области медицины или здравоохранения, утверждали, что существующим исследованиям в ряде дисциплин социальных наук не хватает строгости и что их следует улучшить за счет более широкого использования рандомизированных контрольных испытаний.

Транспортная наука

Исследователи в области транспорта утверждают, что государственные расходы на такие программы, как планы школьных поездок, не могут быть оправданы, если их эффективность не будет продемонстрирована рандомизированными контролируемыми испытаниями. Грэм-Роу и его коллеги проанализировали 77 оценок транспортных вмешательств, обнаруженных в освещенных литературы, разделив их на 5 «уровней качества». Они пришли к выводу, что большинство исследований было низкого качества, и выступили за использование рандомизированных контролируемых исследований везде, где это возможно, в будущих исследованиях транспорта.

Доктор. Стив Мелия не согласился с этими выводами, утверждая, что утверждения о преимуществах рандомизированных контролируемых испытаний в установлении причинно-следственной связи и избежании предвзятости были преувеличены. Он предложил следующие восемь критериев для использования РКИ в контекстах, где вмешательства должны изменить человеческое поведение, чтобы быть эффективными:

Вмешательство:

  1. не применялось ко всем членам уникальной группы людей (например, население всей страны, все сотрудники отдельной организации и т. д.)
  2. Применяется в контексте или настройке, аналогичной той, которая применяется к контрольной группе
  3. Может быть изолирована от других видов деятельности —И целью исследования является оценка этого изолированного эффекта
  4. Имеет короткий промежуток времени между его реализацией и зрелостью его эффектов

И причинные механизмы:

  1. либо известны исследователям, либо в противном случае можно протестировать все возможные альтернативы
  2. Не задействовать существенные механизмы обратной связи между группой вмешательства и внешней средой
  3. Иметь стабильную и предсказуемую связь с экзогенными факторами
  4. Действовать в таким же образом, если бы контрольная группа и группа вмешательства были обратное

Международное развитие

РКИ в настоящее время используются рядом международных экспертов по развитию для измерения воздействия интервенций в области развития во всем мире. Экономисты по развитию в исследовательских организациях, включая Abdul Latif Jameel Poverty Action Lab (J-PAL) и Innovations for Poverty Action, использовали РКИ для измерения эффективности бедности, программы здравоохранения и образования в развивающихся странах.

Для некоторых экономистов-разработчиков главное преимущество использования РКИ по сравнению с другими методами исследования состоит в том, что рандомизация защищает от систематической ошибки отбора, проблемы, присутствующей во многих текущих исследованиях политики развития. В одном примечательном примере кластерного РКИ в области экономики развития Olken (2007) рандомизировал 608 деревень в Индонезии, в которых дороги собирались строить, на шесть групп (без аудита против аудита и без приглашений на встречи по подотчетности против приглашения на собрания по подотчетности или приглашения на собрания по подотчетности вместе с формами анонимных комментариев). Оценив «недостающие расходы» (показатель коррупции ), Олкен пришел к выводу, что государственные аудиты были более эффективными, чем «расширение участия в мониторинге на низовом уровне» в снижении коррупции. В целом в социальных науках важно учитывать как предполагаемые, так и непредвиденные последствия вмешательства для оценки политики.

Криминология

Обзор 2005 года выявил 83 рандомизированных эксперимента по криминологии, опубликованных в 1982–2004 годах, по сравнению с 35, опубликованными в 1957–1981 годах. Авторы классифицировали найденные исследования по пяти категориям: «полицейская деятельность», «предотвращение», «исправления», «суд» и «сообщество». Сосредоточившись только на программах оскорбительного поведения, Холлин (2008) утверждал, что РКИ может быть трудно реализовать (например, если РКИ требовало «вынесения приговоров, которые случайным образом распределяли бы нарушителей по программам») и, следовательно, что эксперименты с квазиэкспериментальным дизайном по-прежнему необходимы.

Образование

РКИ использовались при оценке ряда образовательных вмешательств. В период с 1980 по 2016 год было опубликовано более 1000 отчетов РКИ. Например, в исследовании 2009 года было рандомизировано 260 классных комнат учителей начальной школы, которые получали или не получали программу поведенческого скрининга, вмешательства в классе и обучения родителей, а затем измеряли поведенческую и академическую успеваемость их учеников. Другое исследование 2009 года рандомизировало классы для 678 детей первого класса, чтобы получить вмешательство, ориентированное на класс, вмешательство, ориентированное на родителей, или не вмешательство, а затем отслеживало их академические результаты до 19 лет.

Пробные рандомизированные контролируемые испытания, или моделирование с использованием кондитерских изделий, можно проводить в классе, чтобы научить студентов и медицинских работников принципам дизайна РКИ и критической оценки.

Критики

Обзор 10 наиболее цитируемых рандомизированных контролируемых исследований за 2017 г. распределение фоновых признаков, трудности с ослеплением, а также обсуждались другие предположения и ошибки, присущие рандомизированным контролируемым испытаниям. К ним относятся «ошибка оценки уникального периода времени», «предположение о том, что фоновые характеристики остаются неизменными», «ограничение среднего эффекта лечения», «простое лечение на индивидуальном уровне ограничения», «все предварительные условия полностью выполнены», «количественное ограничение переменной» и «ограничение только плацебо или обычным лечением».

См. также

  • Разработка лекарств
  • Проверка гипотез
  • Оценка воздействия
  • шкала Джадада
  • Статистический вывод

Ссылки

Дополнительная литература

Внешние ссылки

  • Bland M. Справочник программного обеспечения и услуг рандомизации. Йоркский университет, 2008 г. 19 марта.
  • Эванс И., Торнтон Х., Чалмерс И. Тестирование лечения: лучшие исследования для лучшего здравоохранения. Лондон: Пинтер и Мартин, 2010. ISBN 978 -1-905177-35-6 .
  • Гелбанд Х. Влияние рандомизированных клинических испытаний на политику в области здравоохранения и медицинскую практику: справочный документ. Вашингтон, округ Колумбия: Конгресс США, Офис o f Оценка технологий, 1983. (Отчет OTA-BP-H-22.)
  • REFLECT (Рекомендации по отчетности для рандомизированных контролируемых исследований по безопасности жизни и безопасности пищевых продуктов) Заявление
  • Wathen JK, Cook JD. Мощность и систематическая ошибка в адаптивно рандомизированных клинических испытаниях. М. Онкологический центр Д. Андерсона, Техасский университет, 2006 г. 12 июля.

Понравилась статья? Поделить с друзьями:
  • Рандом дайс ошибка
  • Рамка ошибки виндовс
  • Рамблер почта ошибка авторизации
  • Рамблер ошибка сервера
  • Раковую или роковую ошибку