Lossing Russia is easier than making it lose a war

The current anti-Russia sanctions, instead of solely draining the country’s authoritarian institutions, hurt these institutions’ democratic alternatives even more. As a result, after inevitably losing the war with Ukraine, Russia will become a poorer, more authoritarian, and hostile society united by an even stronger desire for retribution. To avert this outcome, there should be an acknowledgment that Russia’s autocracy is upheld solely by unreformed Soviet institutions. I argue that the theories of economic transitions that guided the creation of the Russian modern private sector provide clear theoretical guidance on optimal sanctioning today. Russia’s state higher education and science is an excellent frontier where these optimal sanctions can be tested.

Edited published version here

Countries are not humans

Oddly, international sanctions that cost trillions to the global economy are not guided by a coherent theory or solid empirical regularities. Existing policies implicitly borrow from the criminological theories of incapacitation and deterrence. The idea of incapacitation is as simple as it is old – isolate the offender from society to prevent future offending. Thus, the focus is on halting foreign currency inflow to Russia, including banning Russian export. This erodes Russian governmental global purchasing power and prevents future malicious activity.

Incapacitation is the most expensive and the least effective approach in criminology. The isolation prevents offenders from being productive workers and adversely affects those who depend on them. But most importantly, a country, unlike a human, can never be completely incapacitated. The West may stop buying gas from Russia in the future, but then the East will happily accept the same amount at a discount.

Alternatively, deterrence aims to discourage offences by instilling fear of consequences. A recession might scare a democratic politician who worries about winning a fair election. Russia never had fair elections. The economic sanctions are not scary to Putin and do not exert deterrence. Beyond that, the success of sanctioning is predicated on rationality – an ability to understand tradeoffs. Contrary to that, Putin’s capacity for rational thinking is an activity area of debate.

For Russians, the recession of the 1990s, when the economy underwent an unprecedented structural transformation, is an important benchmark. At the beginning of the transformation, the economy lost 52% of its output. By comparison, during the Great Depression, a textbook example of economic collapse, the American economy declined only by 34%

Many Russia’s rulers of today have been governing since that period. Thus, their tolerance for economic calamities is unimaginably high. The inconsequential sanctions of 2014 only reinforced their confidence that the recovery will inevitably follow once the economy adjusts. In particular, soon after the first 2022 sanctions were implemented, Putin’s government expressed confidence that the economy would recover after a temporary increase in inflation and unemployment.

Sanctions not only do not deter Putin, they feed him. Putin legitimizes his rule by heroically withstanding the economic hardships caused by the West “to put Russia to its knee.” This is not a rhetorical device but literally the message propagandized by Kremlin’s information monopolists. This message conveniently resonates with the Kremlin’s obsession with WWII.

Most Russians have been brainwashed into seeing the Nazi atrocities on the Eastern front, the painful economic transformation of the 1990s (which is also blamed on Americans), and the current economic sanction as a single narrative where Putin is the hero fighting the hoards of enemies inside and outside the country.

All in all, applying criminological thinking of deterrence or incapacitation to countries is incorrect. Even thoroughly personified dictatorships like Putin’s Russia are not humans. The largest drawback of equating a country and a human is the collective blame lazily assigned to all Russians. This is particularly unusual in the age of Black Lives Matter.

A randomly chosen African American is much more likely to be convicted of a criminal offense than anyone else. However, the world is finally waking up to the fact that this outcome results from slavery and system racism. Similarly, Russia’s problem is not its culture or preferences for violence. Russians are firstly the victims of unjust institutions and then the perpetrators.

Sanctions to finish the reforms

The best theoretical guide for optimal sanctioning is provided by the forgotten theory of economic transitions. In the 1990s, setting the economic agents free of deleterious state control was at the core of understanding the transition. The economic resources captured by the inefficient state companies generate well-being if resources are encouraged to relocate into newly created private enterprises.

This thinking motivated the Russian reformers of the 1990s to set prices, capital, and trade free. As a result, after 70 years of nonmarket resource allocation that ruined the Soviet economy, the newly established private sector became a domain of freedom and prosperity never seen in Russia. This, in turn, created a demand for political freedoms. The anti-Putin protest uniquely consisted of educated private-sector workers.

The reforms stopped soon after Putin came to power. His authoritarian rule today hinges solely on unreformed Soviet institutions. These institutions are the world’s enemies. Putinism can only be defeated if sanctions assist in transforming them. Similar to the private sector reform of the 1990s, this can be achieved by releasing resources used in these institutions towards better ones. The sanctions must be targeted to this effect.

Unfortunately, the current sanctions are not designed with this objective in mind. Consider these four examples.

Closing Russian YouTube state channels is an excellent idea, but it is counterproductive to ban all Russians from making money with their channels. After Putin shut down all non-state media, Russians poured into YouTube seeking the information.

The alternative media is the only way to fight the propaganda, and a sensible policy should encourage independent voices. Banning the state propaganda channels is proof that YouTube can identify malicious propaganda and selectively disable it; thus, there was no reason to ban all Russian residents from monetization. The channel’s attitude toward the ongoing war makes this distinction today easier than ever before.

Sanctioning state banks is good because it transfers resources toward entities where the state’s capacity is reduced. Russian state banks are the main sources of corrupt income for Putin’s loyalists. On the contrary, banning all Russians from using their bank cards abroad gives Putin a favor. After Putin attacked Ukraine, 200,000 mostly IT specialists left Russia, causing a panic in the government. Most of them had to return and work to sustain Putin’s regime further because they could not use their funds outside Russia.

Sanctioning the Russian state’s foreign currency reserves is a great idea. It drains the mobster’s ability to reward his abettors with foreign goods that Russians (due to their inability to produce them) value so much. However, buying natural resources from the Russian state companies is counterproductive.

Indeed the purchasing of gas by the European countries has been the single most significant contributor to the maturity of the institutions that support Putin’s illegitimate rule. In addition, these same countries were selling Putin military hardware, against their own post-Crimea 2014 embargo, based on his promise that it won’t be used for military purposes.

One of the anticipated effects of the sanctions was that Putin’s adversely affected social circles would talk him out of war. Only a democratic politician that projects his own life experience could have thought of that. Putin never felt pressure from his constituents (this notion has no place in Russian politics) and spent most of his years in power trying to reduce the influence of oligarchs on politics.

The elites’ support for Putin has only increased after sanctions were imposed. This happens because the collective tribal blame implied by the current sanction regime causes an indiscriminate reduction in Russians’ economic well-being.

Leveraging institutions that Putin can not ban

There is no doubt that Russia will lose the war, but it won’t change the Russian regime unless Soviet totalitarian institutions are still in place. So far, we have seen no evidence that their relative power in society is changing in favor of alternatives. Quite the opposite, many keen observers point out that Russia’s totalitarian feature will worsen and persist long-term. Russia will likely become more aggressive and dangerous too.

Unfortunately, not much can be done at this point. Elections, media, the justice system, everything that conventionally balances autocrats either never existed in Russia or has been emasculated by Putin’s gang. There is, however, one potential avenue for change. Russia’s higher education and science have untapped potential, but only if sanctions, as discussed above, are designed as a clever coordination device to transfer resources away from state-captured institutions toward better ones.

Of all determinants of Russia’s illegitimate power hierarchy, education has a unique property. On the one hand, Russian education is relatively globally integrated; therefore, in the short run, responsive to external impacts. On the other, it may revert the existing power ranking in society. For example, the Russian Academy of Science has historically been a prominent critic of the Russian authoritarian government. It took six long years for Putin to dismantle the Academy. Today the Academy undoubtedly would have been a powerful anti-war voice.

The Russian government harshly regulates state-owned education and uses it as a tool of propaganda and coercion. The deans of nearly all Russian state universities signed the letter supporting the war. Students who protest the war are expelled, while academics who do not support the war are discriminated against. It is also common to see pseudo-historians and conspirologists as faculty members who propagate a warped version of Russian history that justifies violence toward various minorities, ex-Soviet republics, and political opponents.

The opposite is happening in Russian private establishments. Importantly these establishments still have authority within a society, and the public does not eschew them for being “unpatriotic.” Unlike their politicians, Russians do respect and trust their scientists. After all, private establishments like European University at St Petersburg, New Economic School, and the Moscow School for the Social and Economic Sciences are at the top of their fields.

Harsh coordinated sanctions against the Russian state establishments with simultaneous support for private institutions will encourage resource transfer toward the private entities, opposing Putin. Importantly, supporting the private sector is as crucial as sanctioning the state one.

In line with theories of economic transition, the goal is not pain for its own sake but the encouragement of resource transfer. This suggestion is not without an empirical basis. The causal empirical link between better (read free of the authoritarian state capture) education and democracy is well established.

My conclusions may upset some Russian researchers working for the state universities – no need for this. Soon after Russia started the attack on Ukraine, the Russian government banned every media it did not own. Soon after, the same reporters opened their communication channel and now have, as before the ban, an audience of dozens of millions.

The demand for education will never disappear. Even if the government takes a license away from the private universities – the worst outcome – the private universities can still issue certificates. The certificate will still be in demand from the students if the business votes for them by offering better jobs and higher pay.

Unfortunately, on this front, as of now, the world is favoring Putin. The keynote lectures of prominent scientists are being canceled because of their affiliation with a private institute whose leadership publicly condemns the war, risking theirs and their familiar lives and economic well-being. Measures like this are optimal only if the object is to have Putin and his future copycat in power forever.

Consistency

There is another reason why Russian state educational establishments should be a part of sanctions. The education sector is a critical factor during the economy’s transformational adjustments. A rapid change in the availability of technologies requires the education sector to retrain the labor for optimal capital-labor complementarity. For example, computers (or steam or electric engines) are useless if workers don’t know how to use them. This logic extends to organizational technologies too.

My recent paper shows that the Russian transition of the 1990s is a special case of adjustment to new organizational technologies. At the beginning of the transformation, the recession was so strong because the economy lacked personnel (law and business graduates) able to navigate the market environment. The recovery began only after the economy was saturated with properly trained human capital.

The sanctions also change the technologies available to the economy; thus, a change in the labor market will follow. After the education sector optimizes the skill available in the labor market, the economy’s recovery follows. Understanding this, the Russian government declared the Decade of Science and Technology straight after the sanctions were imposed.

Therefore, excluding education from sanctioning is an inconsistent approach because Putin is certain that the recovery, however distant, will follow. Including education, on the other hand, may enable some deterrent effect of the current sanctions. Although, as argued above, to be a credible threat, the economic sanctions should induce a recession larger than the transformation recession of the 1990s without a prospect for recovery. I don’t think sanctions can achieve this, but they can encourage resource transfer toward those willing to resist Putin inside the country. The combined forces might work.

Доказательная государственная политика: опыт Австралии

Редактированная опубликованная версия

Я работаю научным сотрудником (research fellow) в University of New South Wales. Это региональный университет в австралийском штате New South Wales, расположенный в Сиднее. Я работаю в институте, где, в частности, занимаюсь оценкой государственных программ: насколько эффективно были достигнуты поставленные цели конкретного закона или программы.

Я занимаюсь прикладной микроэконометрикой. Последняя Нобелевская премия в области экономики была как раз выдана экономистам, которые начали применять так называемые квазиэкспериментальные подходы при оценке государственных программ. Выявлять причинно-следственные связи сложно. Чтобы с уверенностью утверждать, что какой-то эффект был результатом какой-то государственной программы, раньше нужно было ставить эксперименты – но у экспериментов есть серьёзные ограничения. Квазиэкспериментальные методы, построены на идее, что можно выявить каузальные связи даже в ситуации, когда у нас нет эксперимента. Для этого нужно внимательно посмотреть на обстоятельства введения программы и умело применить современные статистические методы.

Начиная с середины 90, широкомасштабное применение этих методов сильно изменило общественные науки. Есть такой термин credibility revolution, это как раз о том что новые способы выявлять причинно следственной связи в неэкспериментальных условия позволили социальным ученым переосмыслить многие теории которые десятилетиями доминировали в дисциплинах. Credibility revolution также изменила то как ведется государственная политика. Лучшей практикой госуправления считается та которая основана на внимательном изучении последствий государственных программ. В современных странах квазиэкспериментальных методы широко применяются для экономии средств налогоплательщиков при достижение общественно значимых результатов через госуправление.

В современных странах квазиэкспериментальных методы широко применяются для экономии средств налогоплательщиков при достижение общественно значимых результатов через госуправление.

Для меня контекст не имеет значения, я думаю о эконометрическом дизайне, о том, как что-то измерить. Не принципиально, каковы переменные, как они называются: зарплата, убийство на почве ненависти или наркопотребление, единственное, что важно: я должен подумать – можем ли мы утверждать причинно-следственную связь на основе той статистики, которую мы получили в результате измерений? Это – моя специальность. В университете мы часто задаем эти вопросы, постоянно взаимодействуем с органами власти, которые собирают административные данные для своих целей учета, а мы используем их, чтобы улучшить качество государственных программ.

Взаимодействие представителей государства и исследователей в Австралии

Что происходит в Австралии? Очень тесное постоянное сотрудничество между научными центрами, научными сотрудниками, которые занимаются прикладной эконометрикой, и правительством штата. Они пытаются понять, к примеру: каким образом снизить преступность, улучшить общественное здоровье, как обеспечить равный доступ к образованию и рынку труда вне зависимости от пола или других биологических признаков.

Здесь есть открытая коммуникация, готовность государственных органов к диалогу: просто пишешь письма бюрократам. Они тоже, конечно, часто не понимают, о чём речь, когда пытаешься говорить о статистических методах, но это нормально. Самое главное, что они готовы слушать тебя, открыты к критике. Как только политики начинают интересоваться тем, что беспокоит людей, тогда взаимодействие между политиками и обществом происходит естественным образом. Научные сотрудники, научные институты – часть общества.

Здесь ведётся дискуссия о том, какие законы вводить, это обычно называют public policy (англ. “государственной политике” – прим. ред). Экспертное сообщество обсуждает, как сделать лучше, смотрят на опыт других стран, данные. Политиков выбирают на основе их программ. Есть бюрократы, которые слушают политиков, и выполняют их поручения. Это бойкая игра, где люди говорят, думают, и пытаются сделать так, чтобы жизнь была лучше.

Взаимосвязанность административных данных

Public policy community – сообщество, которое занимается выработкой государственных программ. Это не только люди, принимающие законы, это экспертное сообщество, которое обсуждает эти законы, литературу. Очень часто мы запрашиваем административные данные и используем их, чтобы улучшить какой-то аспект жизни общества. Есть центр, который занимается статистикой по преступлениям, где содержится база всех людей, которые прошли через систему правосудия. Мы в нашем центре подаёмся на грант, который позволит нам взять данные всех людей, по кому принимали решения судьи – миллионы людей за 30 лет. Мы хотим посмотреть последствия того, что человек пошёл в тюрьму? Какие будут последствия? Как это скажется на его возможности быть полезным членом общества? Мы будем смотреть: какова вероятность того, что человек попадёт в тюрьму опять после того, как его выпустят? Если человек пошёл в тюрьму повторно из-за того, что был в тюрьме до этого, то мы можем утверждать, что существующая система санкций неэффективна.

Она поощряет преступление, нежели де-стимулирует его.

Тут есть человек, ответственный за такие данные. Более того, здесь есть специальный департамент, который занимается этими данными. И есть специальный орган, отдельная часть в правительстве штата, который помогает связать административные данные между собой. К примеру, есть регистратор людей, которые попали в скорую помощь с передозировкой какого-то токсичного вещества: алкоголя, или наркотика.

Посмотрев на человека, который был в тюрьме и вышел оттуда, можно понять, попал ли он в какое-то время до или после тюрьмы в скорую помощь в результате сильной интоксикации алкоголем. Мы можем реально отследить взаимосвязь тюремного опыта и риска отравления алкоголем. Это здОрово, потому что это важный вопрос.

Или есть некий полицейский орган, который делает случайный замер алкоголя в крови. Эти данные собираются и хранятся для собственных административных целей. Ты можешь написать в этот орган и сказать “Мне очень хочется посмотреть, оценить, насколько вообще эффективна такая практика – действительно ли она снижает аварийность, или потребление алкоголя, или ещё что-то”. И эти данные принципиально можно получить. Нужно будет получить этическое разрешение от твоего института, написать и объяснить бюрократам целесообразность, нужно, чтобы бюрократы обезличили данные (очевидно, это чувствительные данные – мы не должны узнать, что конкретный человек много пьёт). Административно– это очень сложно, потому что нужно оплатить время бюрократам (как раз для этого пишутся гранты), заполнить кучу бумажек, объяснить всё. Исследователи на это тратят большую часть времени. Но принципиально – можно.

Квазиэксперимент для анализа проводимой политики

У нас есть интересная статья. В Австралии, как и во многих развитых странах, государство пытается снизить аддикцию. Здесь очень серьёзно относятся к проблеме аддикции: люди злоупотребляют алкоголем, опиоидами (героином), различными субстанциями, чаще совершают преступления. Это огромная проблема, которая обсуждается во всех странах OECD, в развитых странах: как сделать так, чтобы люди перестали злоупотреблять опасными веществами? Вообще для России это проблема еще актуальнее, но, к сожалению, эта тема не обсуждается, так как следовало бы.

Есть такой взгляд: нужно накладывать санкции. Но это средневековый подход с однобоким взглядом на проблему. В соответствии с ним, нужно очень сильно бить людей, которые употребляют наркотики, чтобы они перестали. Но практически все исследования указывают на то, что этот метод не работает, он не может чего-либо достичь. Это неэффективно: очень дорого, потому что нужно содержать репрессивные институты, и, что самое главное, мы не можем победить алкоголизм или наркозависимость, наказывая людей.

В нашем штате людей, которые употребляют и хранят наркотики (но не торгуют ими) штрафуют (на не очень крупные суммы), практика существует много лет. Мы пытались понять: когда мы оштрафовали человека, он больше не употребляет, не появляется среди уголовников? Смогли ли мы так победить аддикцию? В криминологии это называется specific deterrence (англ. «cдерживание от совершения действий лиц, которые подвергаются наказанию, устрашением» – прим. ред.): мы смотрим, повторяет ли человек преступление после того, как к нему приложили санкцию?

Чтобы ответить на этот вопрос, мы взяли базу данных о людях, которые прошли через систему правосудия, и использовали интересный квазиэкспериментальный метод.

Здесь по закону не должно быть связи, корреляции между судьёй и ответчиком (нормальная практика с точки зрения права). Судья, который рассматривает дело, должен быть абсолютно независим. Квазиэксперимент строится на том, что у каждого судьи есть индивидуальная особенность в величине штрафа, который он накладывает на наркопотребителей, на ответчиков. И, поскольку судья назначается на каждое дело случайным образом, мы посмотрели на ситуацию так, будто это эксперимент. Мы

использовали случайную аллокацию судей к ответчикам (очень много данных за 1990- е, 2000-е, 2010-е годы), чтобы ответить на вопрос: эффективно ли накладывать штрафы на наркопотребителей? Ответ, который мы получили: нет, это не позволяет снизить наркозависимость и вообще не имеет никакого значения! Если называть своими именами, отбросить всё и посмотреть на суть, система накладывания штрафов на наркопотребителей – это очень странная система лицензирования.

Можешь просто употреблять наркотики, но должен заплатить штраф, и продолжать это делать так же, как раньше.

Альтернатива системам санкций – harm reduction (снижение ущерба). Такой подход признаёт, что аддикция – диагноз, который требует лечения. Поэтому нужно дестигматизировать это явление, чтобы человеку, который зависим, не было стыдно за то, что он делает, чтобы он чувствовал себя в безопасности, чувствовал, что о нём заботятся: тогда сильно повышается шанс того, что человек будет искать способы лечения. Важно признать в общественной дискуссии, что сама аддикция это только верхушка айсберга, а значительный источник проблемы спрятан в социально- экономический плоскости, которую россияне коллективно создают. То есть люди с аддикцией это жертвы, а не преступники.

Недавно был введено термин death from despair – смерть от отчаяния. Это смерти при которых люди по сути совершают суицид через злоупотребление токсичными веществами. Они это делают от ощущения безысходности когда они не видят перспектив и не имеют контроля над своим будущим. К примеру, текущая политическая и социальная-экономическая ситуация в России в теории должна порождать огромное количество смертей от отчаяния. Я думаю что ИНИДу стоит посмотреть на данные по количеству и причинам вызовов скорой помощи и сопоставить эти данные с базой муниципалитетов. Тут большой потенциал для анализа. Еще лучше было бы сопоставить эти данные с налоговыми данными, затем охарактеризовать территории по критерию экономических возможностей, неравенства и поляризации и затем посмотреть как безысходность порождает злоупотребление субстанциями и смерть. Для оценки влияния угнетающей политической ситуации, можно посмотреть, например, на то как особо колоритные выпуски госновостей “о врагах России” влияют на инфаркты. Это все очень важные вопросы. Ведь погибшие люди это чьи-то дети, отцы, бабули.

Одно из статей которую мы пишем была бы особенно интересна и актуальна для России. Здесь, когда ты хочешь открыть бар, или открыть магазин, который продаёт алкоголь, ты должен получить лицензию. Количество и местоположение выдачи этих лицензий регулируется: хорошо известно, что существует связь между употреблением алкоголя и преступностью, особенно, между алкоголем и домашним насилием, или battery, когда ты просто дерёшься с людьми.

Комитетом по играм и алкоголю был объявлен тендер, чтобы узнать, насколько доступность алкоголя влияет на домашнее насилие и преступность, на assults, когда люди атакуют друг друга. Мы будем отвечать на этот вопрос вместе с консалтинговой компанией Deloitte («Делойт»). Все научные коллективы, консалтинговые компании, научные центры или кто угодно могут подать документы, и государство оплатит расходы на эту работу. Оно хочет понять, где распределять лицензии и в каком

количестве. Меньшее количество лицензий может снизить преступность. Само государство ищет ответы, спрашивает: “Люди должны пить, это часть жизни, но как сделать так, чтобы они чтобы пили безопасным образом? Помогите нам”.

Для того чтобы измерить влияние баров на преступность мы обратились к уникальный исторической особенности Австралии. Дело в том, чтобы в Австралии в прошлом проблема с алкоголизмом имела катастрофические размеры, ведь, по сути, Австралия это Британский ГУЛАГ. Из-за этого тут есть две особенности: пабы очень крупные и очень старые. Это из-за того, что предложение алкоголя очень жестко регулировалось тут с давних времен. И вот так вышло, что в 1919 году некоторые муниципалитеты отказались от пабов в результате голосования и это сделало так, что сегодня есть места где больше и меньше баров из-за результата того голосования. Мы используем результаты этого голосования для получиния квазиэкспериментальной вариации в количестве пабов, чтобы оценить как доступность алкоголя влияет на преступность.

Против течения: влияние исследований на проводимую политику

Другая статья, которую мы недавно закончили, тоже рассматривает вопрос в области аддикции. Supervised medical injection rooms (англ. “кабинеты для инъекций под наблюдением врача” – прим. ред.) – это такое место, где наркозависимые люди, которые используют опиоиды, могут прийти и безопасно под контролем медперсонала использовать наркотики. Это уже много десятилетий есть в Европе (в частности, в Германии) и Канаде. Австралия – довольно консервативная страна, здесь injection rooms появились относительно недавно: одна была в Сиднее, в прошлом году открыли ещё одну в Мельбурне.

Очень болезненный вопрос, одна из главных забот для обычного среднего австралийца – жильё. Оно здесь очень дорогое, люди заботятся о нём, и требуют от политиков, чтобы у всех была возможность получить своё жильё. В нашей недавней работе, которая связана с harm reduction, мы хотели посмотреть, что происходит после открытия injection room в Мельбурне с привлекательностью жилья, которое находится рядом? Мы показали очевидный факт, труизм: цены там снизились, и это плохой результат. Для многих людей жильё – самый большой актив, и снижение его стоимости без вины владельцев – это плохо, ужасно, нечестно. Мы показываем, что открытие injection room снизило стоимость жилья в радиусе 400 метров на 6%. Может быть, harm reduction – хороший подход, который действительно помогает людям избавиться от аддикции, но у него есть последствия: происходит концентрация наркопотребления, что приводит к снижению стоимости жилья в этом районе. Это огромная проблема.

Мы ожидаем, что статья расстроит очень многих людей. Здесь, в Австралии, крайне сильно медицинское лобби, и медицинское сообщество обожает harm reduction approach (англ. “подход, снижающий вред” – прим. ред.). Они хотят победить аддикцию, раздав наркотики всем (это шутка, конечно, тут много нуансов и канабиз без сомнений надо лигалезовать; сложно найти научный вопрос где все работы указывает, что криминализация канабиза бессмыслена и вредна). Но в литературе часто говорится о том, что вследствие дестигматизации люди больше начинают употреблять наркотики. В Мельбурне никак не могли открыть injection room: открыли только после

того, как женщина в 2019 году умерла от передозировки в KFC. Была серьёзная комиссия от государства, результатом работы которой стало решение что-то сделать. И вот, научный фронтир медицинского сообщества говорит, что injection rooms могут снизить смерти и повысить вероятность того, что люди будут искать лечение. И очень многие люди лоббировали введение этой injection room.

Мы говорим, что проблематичность, скорее всего, могла быть снижена, если бы о появлении injection room сообщили заранее, допустим, за 5 лет. Тогда застройщики могли бы учитывал в своих планах, что здесь будет повышенная концентрация наркопотребления (это называется джентрификация). И можно было бы этот район построить таким образом, чтобы снизить exposure (англ. “возможные риски” – прим. ред.), чтобы обычные работяги-австралийцы не были шокированы, не страдали бы, к примеру, от разбросанных шприцов. Мы показали, что стоимость апартаментов и домов снижается, но обнаружили, что стоимость аренды апартаментов почему-то увеличилась. Это говорит о том, что появился спрос на это жилье. Мы думаем, причина в строительстве множества новых апартаментов с использованием новых стандартов безопасности. К примеру, они не имеют прямого выхода на улицу. Без карточки ты не можешь ни зайти в дом, ни пользоваться лифтом. Если выстроить джентрификацию таким образом, чтобы обычные люди не видели наркопотребления, обезопасить их, это принципиально может сработать. И мы сможем получить преимущества от injection rooms, снизив недостатки.

Административные данные и исследования для улучшения жизни в России

Административные данные используются во многих развитых странах мира, где существует диалог между обществом и государством, это стандартная практика. Когда я увидел ИНИД, я обнаружил, что в России тоже начали появляться административные данные. Я нашёл данные по безработным – по всем людям, которые обращались в органы трудоустройства. Мне стало любопытно: можно ли что- то с ними сделать? Самый очевидный вопрос, на который можно ответить с помощью этой базы данных: однажды обратившись к органам занятости, человек обратится к ним опять? Если да, можно заключить, что он не нашёл работу и органы занятости не работают эффективно, а если нет, то он нашёл работу и органы работают. Я не стал заниматься этими данными, потому, что получив доступ я понял, что с этими данными есть принципиальное ограничение. Проблема в том, что если человек не обратился вновь в эту базу – мы не знаем, может быть он нашёл работу с помощью других средств, а туда решил больше не обращаться. Это принципиальное ограничение, которое можно было бы решить, если эти административные данные связать с другими, например, с налоговой базой.

Я работаю в Австралии, но я из России, и душа трепещет по поводу России, в том числе. Мне всегда интересно написать статью, что-то сделать, улучшить. Очень интересно было бы найти коллег из России людей, которым это тоже интересно, соавторов, которые помогут мне с административными делами. Я бы с удовольствием подался на какой-то грант, чтобы запросить новые данные от бюрократов, начать

дискуссию. Как улучшить ситуацию в тюрьме, к примеру? Настолько важный вопрос! Как вообще можно об этом не говорить?

Если поставить правильные вопросы и получить правильные данные, можно сделать так, что люди станут жить лучше и дольше. Мне бы очень хотелось, чтобы ИНИД добился от бюрократов получения данных: административных данных по всем уголовникам (индивидуальный уровень), данных по срочникам в армии. Или связал административные данные от налоговых органов с данными по призыву. Нужно понять, каковы издержки того, что люди служат в армии, издержки того, что люди идут в тюрьму, того, что людей не лечат, а вместо того, чтобы давать возможность лечиться, накладывают санкции. Нужны данные, чтобы квантифицировать все эти проблемы, чтобы они приобрели конкретные критерии. Нам нужны хорошие методы, хорошие данные. Если ИНИД сделает это, будет великолепно.

То, что делает ИНИД – очень здорово. Просто нужно натренировать бюрократов пару раз, потом это становится для них привычкой. И здесь, в Австралии, эта привычка уже есть. В России всё это тоже существует формально, но не так активно используется. Надо раскачивать. Пожалуйста, передайте мои контакты всем российским заинтересованным ученым и мы будем думать какие данные нужны и для каких вопросов.

Australian alcohol tax system impedes public health policy

An edited version is published here

Would you and your mates cancel a celebration if the price of your usual drink went up while the prices of other alcoholic beverages remained the same? Most likely, no. Paradoxically, the current system of regulation is predicated on the assumption that you would. Tax is the main means by which the Australian Government tries to influence alcohol consumption. Australia, however, has four different tax regimes and two different modes of taxation. Beer is subject to eight different excise rates, and brandy is taxed differently from other spirits, while wine has its own special tax arrangements. As a result, there is no effective policy tool; instead, policymakers have to engage multiple diverse artificial and politically expensive processes to regulate one product.

Alcohol abuse imposes an enormous health burden on the community. The acute burden of abuse is felt mainly by the young, a disproportionate number of whom are killed through accident and misadventure. Getting alcohol policy right means getting the system of taxation right. While the complexity of the Australian system of taxation of alcohol has been criticized for decades, our new study shows that our tax system is incapable of delivering an effective policy response to the problem of alcohol use by young people.

During 2008 and 2009, in response to a growing concern that ready-to-drink (RTD) beverages were encouraging a culture of binge drinking by adolescents, the Australian Government increased the tax on RTDs by 70% to specifically target adolescent drinking. Our new study showed this massive tax did not affect alcohol consumption of those under 25 years old (the tax targeted age group). Instead, the tax reduced drinking among those aged 25 – 69, reducing their average daily consumption of standard drinks by 8.9% from 2010 to 2018.

We argue that the age group under 25 did not respond to the tax because young people have no problem switching to a different product if their preferred drink increases in price. The alcohol industry anticipated the switch and provided further price and marketing encouragement for it. We also show that the 29% wine equalization tax rebate of 2004 actually increased drinking among those under 25. The rebate was effectively a subsidy, propping up the production of cheap wines.

These observations show that the drinking of young Australians is sensitive to the presence of the cheapest drinking options. Therefore alcohol tax policy should avoid focusing on particular types of beverages. A better approach would be to introduce a floor price on alcohol per standard drink or replace the current taxation system on alcohol with a uniform volumetric tax per standard drink, applied across all alcohol products, as recently pioneered by the Northern Territory.

The innovation of our study is that, unlike previous studies, which compared alcohol consumption before and after the RTD tax, we employ quasi-experimental techniques that allow us to separate the effect of the tax on different age groups. We also use individual-level data from the Household Income and Labor Dynamics in Australia survey rather than aggregate-level data. The basic logic of our estimation approach is clarified in the figure below.

Source: Alexeev and Weatherburn (2021)

The figure shows the Australian national annual drinking trends with population broken into three age groups. The age group above 70 (blue line) was unaffected by the RTD tax. We use it as a comparison group. The effect of the RTD tax on the age groups 25 – 69 (red line) is easily distinguishable. The time trend for this age group goes up, right before the tax increase, and then goes down. Drinking by the age group 15 – 25 (green line) generally follows a downward trend.

The first arrow points to a visible rise in adolescent drinking in 2005 – the consequence of the 29% wine equalization tax rebate of 2004. The second arrow points to an area where the RTD tax should have had an effect. The downward trend continues without any change, showing no impact on drinking. The general downward trend is in line with other studies that show a global reduction in drinking among young people. Therefore, an approach that compares young people drinking before and after the tax gives the erroneous impression that the RTD tax reduced drinking by young people.

In introducing the RTD tax, the Australian Government was obviously concerned about protecting young Australians. We hope that our findings persuade the Australian Government to take a more sophisticated and effective approach to alcohol taxation. The current taxation system benefits political lobbyists at the expense of the public health of Australians.

COVID-19 Locking Australians into an Undetected Rental Trap

An edited version is published here

COVID-19 has resulted in an up to 15% increase in property prices in Australia, further exacerbating the Australian housing affordability crisis and locking millions of Australians into the rental trap. The average Australian knows that paying rent instead of being a home owner puts them in a disadvantaged position. Unlike mortgage payments, which are effectively savings, money wasted on rent will never be used on a family’s education or health. Therefore, the average Australian would be surprised to learn that when researchers and the government quantify Australians’ equality of opportunities, they ignore the fact that some people have to pay rent while others do not.

In this study, I demonstrate the significance of this omission. Using data for Australia, the US, and Germany, he finds that only Australia sees a noticeable reduction in the equality of opportunities after accounting for the fact that some people spend money on rent and others do not. The findings challenge the Australian government’s claimed success of providing citizens with equality of opportunities and show hidden and ignored inequalities.

“Intergenerational income mobility” refers to the degree to which an individual’s position in the income distribution persists or changes from one generation to the next. For example, a society in which an individual’s adult income is altogether independent of their parents’ income is a highly mobile society. A society in which one’s percentile in the income distribution is always identical to one’s parents’ percentile is completely immobile.

In a practical sense, intergenerational income mobility demonstrates how individuals’ economic well-being is determined by a factor they never had a chance to influence: their parents’ economic well-being. Intergenerational income mobility is a measure of equality of opportunities. This measure, similarly to GDP, is routinely calculated for all countries in the world. Ranking of countries by this measure is an occasional source of pride for Australians.

The accepted practice while measuring the extent of mobility is to use disposable income. A rarely mentioned problem with this practice is that using disposable income risks misinterpreting the evolution of standards of living because economic well-being is determined not only by the goods one can buy in the market but also by sources of incomes that are in-kind (such as publicly provided health and education services) and non-monetary (such as imputed rents for owner-occupied accommodation and the consumption of one’s own produce). For that reason, income measures that include in-kind and non-monetary sources of income are conceptually superior.

One component of non-monetary income that has particular quantitative significance is home ownership. One’s home is a financial asset and a source of services that influences standards of living through various psychological and consumption benefits. Since those who do not own their accommodation have to pay rent to access similar services, and the fraction of home owners differ across countries and within countries across time, ignoring these differences can produce time-series and cross-sectional comparability problems. One way to solve these problems is to assign a monetary value to home ownership. This hypothetical income stream is known as imputed rent. The imputed rents are often ignored in microlevel studies because they complicate the analysis.

Consider, for example, two individuals with an annual income of $50,000. One lives in a $2 million house, the other with his/her parents. The first person could have rented their house out for a substantial amount of money, and the rent imputation method would include this hypothetical payment into their income. Conversely, ignoring imputed rents suggests that both individuals are equally well off. Figuratively speaking, homes are legalised “offshore accounts” that allow hiding wealth. Other researchers have shown that this is a common method to access the Australian means-tested government system of benefits, as owner-occupied accommodation is exempted from those tests. This behavior encourages excessive home ownership, exacerbating further the affordability crisis.

My paper is the first to demonstrate that excluding imputed rent might noticeably mute the intergenerational transmission of income for some countries and not others. The imputed rent substantially decreases intergenerational relative income mobility in Australia by 22.03%, whereas the effect on mobility in both the US and Germany is negligible (not statistically different from zero).

The results should be understood in the context of the ongoing Australian housing affordability crisis. The results show that “the Australian dream” of owning a house within city limits competes with the country’s egalitarian aspirations. Actions that reduce imputed rent relative to income would also likely increase intergenerational mobility in Australia. The reasons for currently high imputed rent are likely structural. In Australia, unlike Germany or the United States, higher-paid jobs are spatially concentrated in a few locations, while the urban population density is low.

The Australian example cautions against using only readily available disposable income for international or time-series comparison as this measure does not include home ownership. Australian public policy explicitly aims to ensure that children growing up in the poorest households have the same adult earnings prospects as children from more affluent families. These aims are unachievable without resolving the housing affordability crisis first.

A noticeable increase in housing prices during COVID-19 would, in reality, exacerbate the equality of opportunities further, yet as standard measures of mobility ignore home ownership, this exacerbation will go undetected by both researchers and the Australian government. At the same time, higher-paid workers, those who did not lose their jobs during the lockdowns, and those with access to parental financial help, will concentrate home owners in their hands with a potential to extract rent from less fortunate but no less hard-working Australians.

Intermediate Microeconomics (UTS)

Dear students, please use the videos below if you missed a class. Please note, however, that these are, in essence, my “preparation notes”, and are not designed to completely substitute tutorials. I’m using pencasts as a motivation to work through the problems (a credible threat of a sort).


Solutions
Solutions by Jonathon Livermore
Pencasts:
Tutorial 1. Q1 Q2 (notes)
Tutorial 2. Q1 Q2 Q3 Q4
Tutorial 3. Q1 Q2 Q3 Q4 (notes)
Tutorial 4. Q1 Q2 Q3 Q4 (notes)
Tutorial 5. Q1 Q2 Q3 (notes)
Tutorial 6. Q1 Q2 Q3 Q4 (notes)
Tutorial 7. Q1 Q2 (notes)
Tutorial 8. Q1 Q2
Tutorial 9. Q1 Q2 Q3
Tutorial 10. Q1 Q2 Q3
Tutorial 11. Q1
Students’ reviews

Some simple probability formulas with examples

A known relationship that is usually given axiomatically:

P(B|A) = \frac{{P(AB)}}{{P(A)}}

Upon rearrangement gives the multiplication rule of probability:

P(AB) = P(A)P(B|A) = P(B)P(A|B)

Now observe a cool set up that is handy to keep in mind for proving the law of total probability and Bayes’ theorem.

Imagine that B happens with one and only one of n mutually exclusive events A_1, A_2,..., A_n, i.e.:

 B = \sum\limits_{i = 1}^n {B{A_i}}

By addition rule:

B = \sum\limits_{i = 1}^n {P(B{A_i})}.

Now by multiplication rule:

B = \sum\limits_{i = 1}^n {P({A_i})P(B|{A_i})}.

This is the law of total probability

From the same set up imagine that we want to find the probability of even A_i if B is known to have happened. By the multiplication rule:

P(A_i B) = P(B)P(A_i|B) = P(A_i)P(B|A_i)

By neglecting P(A_i B) and dividing the rest through P(B) we get:

P\left( {{A_i}|B} \right){\rm{ = }}\frac{{P({A_i})P(B|{A_i})}}{{P(B)}}

And applying the law of total probability to the bottom we have the Bayes’ equation

P\left( {{A_i}|B} \right){\rm{ = }}\frac{{P({A_i})P(B|{A_i})}}{{\sum\limits_{j = 1}^n {P({A_j})P(B|{A_j})} }}

Bunch of examples:

Problem: P_t (k) is a known probability of receiving k phone calls during time interval t. Also k=0,1,2,.... Assuming that a number of received calls during two adjeicent time periods are independent find the probability of receiving s calls for the time interval that equal 2t.

Solution: Let A_{b.b + t}^k be an event consisted of k call in the interval b till b+t. Then clearly

A_{0,2t}^s = A_{0,t}^0A_{t,2t}^s + ... + A_{0,t}^sA_{t,2t}^0

which means that the event A_{0,2t}^s can be seen as sum of s+1 mutually exclusive events, such that in the first interval of duration t number of calls received is i and in the second interval of the same duration number of received calls is s-i (i=0,1,2,...,s). By rule of addition

P(A_{0,2t}^s) = \sum\limits_{i = 0}^s {P(A_{0,t}^iA_{t,2t}^{s - i})}.

By the rule of multiplication

P(A_{0,t}^iA_{t,2t}^{s - i}) = P(A_{0,t}^i)P(A_{t,2t}^{s - i})

If we change the notation so that

{P_{2t}}(s) = P(A_{0,2t}^s)

then

{P_{2t}}(s) = \sum\limits_{i = 0}^s {{P_t}(s) \cdot P(s - i)}.

It is known that under quite general conditions

{P_t}(k) = \frac{{{{(at)}^k}}}{{k!}}\exp \{ - at\} {\rm{ }}(k = 0,1,2...)

(Recall that the Poisson distribution is an appropriate model if the following assumptions are true. (a) k is the number of times an event occurs in an interval and k can take values 0,1,2,.... (b) The occurrence of one event does not affect the probability that a second event will occur. That is, events occur independently. (c) The rate at which events occur is constant. The rate cannot be higher in some intervals and lower in other intervals (that kinda a lot to take on faith really). (d) Two events cannot occur at exactly the same instant; instead, at each very small sub-interval exactly one event either occurs or does not occur. (e) The probability of an event in a small sub-interval is proportional to the length of the sub-interval.  Or instead of those assumptions, the actual probability distribution is given by a binomial distribution and the number of trials is sufficiently bigger than the number of successes one is asking about (binomial distribution approaches Poisson).)

Parametrisation then gives

{P_{2t}}(s) = \sum\limits_{i = 0}^s {\frac{{{{(at)}^s}}}{{i!(s - i)!}}\exp \{ - 2at\} } {\rm{ = }}{(at)^s}\exp \{ - 2at\} \sum\limits_{i = 0}^s {\frac{1}{{i!(s - i)!}}}

Note that

\sum\limits_{i = 0}^s {\frac{1}{{i!(s - i)!}} = \frac{1}{{s!}}\sum\limits_{i = 0}^s {\frac{{s!}}{{i!(s - i)!}}} = \frac{1}{{s!}}{{(1 + 1)}^s} = \frac{{{2^s}}}{{s!}}}

Then

{P_{2t}}(s) = \frac{{{{(2at)}^s}\exp \{ - 2at\} }}{{s!}}{\rm{ }}(s = 0,1,2,...)

The key point is that if for time interval t we have that parametrized formula for 2t we have the one above. It holds true for any multiples of t as well.

A simple fact about sets

Out of n elementary events one can get

\sum_{m=1}^{n} C_{n}^{m} = 2^n - 1

possible outcomes. Where C_{n}^{m} is an event that contains m elementary events. Take set

\{ a,b,c\}

with the size as the only characteristic n=3. Then it power set

\{ \{ a\} ,\{ b\} ,\{ c\} ,\{ a,b\} ,\{ a,c\} ,\{ b,c\} ,\{ a,b,c\} ,\{ \emptyset \} \}

contains {2^3} = 8 elements. 3 event for one element each, C_{3}^{1}. Then 3 events with two element, C_{3}^{2}. Finally, 1 event for one with all elements, C_{3}^{1}. A emply set is an impossible event.

I personally think that this simple fact is amazing, but some would say it is kinda boring. Here is an interesting question for those.

A pack of cards that has 36 cards is randomly split equally into halves. What is the probability that halves have equal amount black and red cards?

This is just another set with 36 elements of two type.

p = \frac{{C_{18}^9 \times C_{18}^9}}{{C_{36}^{18}}} = \frac{{{{(18!)}^4}}}{{36!{{(9!)}^4}}}

The denominator indicates all possible equally likely ways the pack can be split.

Instead of computing that manually one can use this asymptotic equality

n!\ \approx \sqrt {2\pi n} \cdot {n^n}{e^{ - n}}

Thus

18!\ \approx {18^{18}}{e^{ - 18}}\sqrt {2\pi \cdot 18}

9!\ \approx {9^9}{e^{ - 9}}\sqrt {2\pi \cdot 9}

36!\ \approx {36^{36}} \cdot {e^{ - 36}}\sqrt {2\pi \cdot 36}

Which means

p \approx \frac{{{{(\sqrt {2\pi \cdot 18} \cdot {{18}^{18}} \cdot {e^{ - 18}})}^4}}}{{\sqrt {2\pi \cdot 36} \cdot {{36}^{36}} \cdot {e^{ - 36}}{{(\sqrt {2\pi \cdot 9} \cdot {9^9} \cdot {e^{ - 9}})}^4}}}

Simple algebra yields

p \approx \frac{2}{{\sqrt {18\pi } }} \approx \frac{4}{{15}} \approx 0.26

The result fascinates me. The graph visualizes data from a real experiment where a pack is split equally 100 times and \mu is a cumulated sum if exactly 9 red cards are observed in on of the halves. What is crazy is that we were able to see the results of this experiments without doing any experiments, by simply reasoning mathematically about things.

More on this topic: Гнеденко-1988 

Distribution of a ordered pile of rubble

Imagine a pile of rubble (X) where the separated elements of the pile are stones (x_i). By picking n stones we form a sample that we can sort by weight. A sequence x_1,x_2,...,x_n becomes x_{(1)},x_{(2)},...,x_{(m)},...x_{(n)}, where (m) is called “rank”.

Pretend that we do the following. Apon picking a sample and sorting it we put stones into n drawers and mark each drawer by rank. Now repeat the procedure again and again (picking a sample, sorting and putting stones into drawers). After several repetitions, we find out that drawer #1 contains the lightest stones, whereas drawer #n the heaviest. An interesting observation is that by repeating the procedure indefinitely we would be able to put all parenting set (the whole pile or the whole range of parenting distribution) into drawers and later do the opposite — take all stones (from all drawers) mix them to get back the parenting set. (The fact that distributions (and moments) of stones of particular rank and the parenting distribution are related is probably the most thought-provoking)

Now let us consider the drawers. Obviously, the weight of stones in a given drawer (in a rank) is not the same. Furthermore, they are random and governed by some distribution. In other words, they are, in turn, a random variable, called order statistics. Let us label this random variable X_{(m)}, where m is a rank. Thus a sorted sample looks like this

X_{(1)},X_{(2)},...,X_{(m)},...,X_{(n)}

Its elements X_{(m)} (a set of elements (stones) x from the general set X (pile) with rank m (drawer)) are called m order statistics.

//////////////

Elements X_{1} and X_{(n)} are called “extreme”. If n is odd, a value with number m=\frac{(n+1)}{2} is central. If m is of order \frac{n}{2} this statistics is called “m central” A curious question is how define “extreme” elements if n \to \infty. If n increases, then m increases as we.

//////////////

Let us derive a density function of m order statistics with the sample size of n. Assume that parenting distribution F(x) and  density f(x) are continues everywhere. We’ll be dealing with a random variable X_{(m)} which share the same range as a parenting distribution (if a stone comes from the pile it won’t be bigger than the biggest stone in that pile).

Untitled

The figure has F(x) and f(x) and the function of interest \varphi_n (\cdot). Index n indicates the size of the sample. The x axis has values x_{(1)},...,x_{(m)},...,x_{(n)} that belong to a particular realization of X_{(1)},X_{(2)},...,X_{(m)},...,X_{(n)}

The probability that m-order statistics X_{(m)} is in the neuborhood of x_{(m)} is by definition (recall identity: dF = F(X + dx) - F(x) = \frac{{F(x + dx) - F(x)}}{{dx}} \cdot dx = f(x) \cdot dx &s=-3):

dF_{n}(x_{(m)})=p[x_{(m)}<X_{(m)}<x_{(m)}+dx_{(m)}]=\varphi_n (x_{(m)})dx_{m}

We can express this probability in term of parenting distribution F(x), thus relating \varphi_n (x_{(m)}) and F(x).

(This bit was a little tricky for me; read it twice with a nap in between) Consider that realization of x_1,...,x_i,...,x_n is a trias (a sequence generated by parenting distribution, rather then the order statistics; remember that range is common) where “success” is when a value X<x_{(m)} is observed, and “failure” is when X>x_{(m)} (if still necessary return to a pile and stone metaphor). Obviously, the probability of success is F(x_{(m)}), and of a failure is 1-F(x_{(m)}). The number of successes is equal to m-1, failures is equal to n-m, because m value of x_m in a sample of a size n is such that m-1 values are less and n-m values are higher than it.

Clearly, that the process of counting of successes has a binomial distribution. (recall that probability of getting exactly k &s=-3 successes in n &s=-3 trials is given by pms: p(k;n,p) = p(X = k) = \left( \begin{array}{l} n\\ k \end{array} \right){p^k}{(1 - p)^{n - k}} &s=-3 In words, k &s=-3 successes occur with p^k &s=-3 and n-k &s=-3 failures occur with probability (1-p)^{n-k} &s=-3. However, the k &s=-3 successes can occur anywhere among the n &s=-3 trials, and there are \left( \begin{array}{l} n\\ k \end{array} \right) &s=-3 different ways of distributing k &s=-3 successes in a sequence of n &s=-3 trials. A little more about it)

The probability for the parenting distribution to take the value close to x_{(m)} is an element of dF(x_{(m)})=f(x_{(m)})dx.

The probability  of sample to be close to x_{(m)} in such a way that m-1 elements are to the left of it and n-m to the rights, and the random variable X to be in the neighborgood of it is equal to:

C_{n - 1}^{m - 1}{[F({x_{(m)}})]^{m - 1}}{[1 - F({x_{(m)}})]^{n - m}}f({x_m})dx

Note that this is exactly p[x_{(m)}<X_{(m)}<x_{(m)}+dx_{(m)}], thus:

\varphi_n (x_{(m)})dx_{m}=C_{n - 1}^{m - 1}{[F({x_{(m)}})]^{m - 1}}{[1 - F({x_{(m)}})]^{n - m}}f({x_m})dx

Furthermore if from switching from f(x) to \varphi_n (x_{(m)}) we maintaine the scale of x axis then

\varphi_n (x_{(m)})=C_{n - 1}^{m - 1}{[F({x_{(m)}})]^{m - 1}}{[1 - F({x_{(m)}})]^{n - m}}f({x_m})

The expression shows that the density of order statistics depends on the parenting distribution, the rank and the samples size. Note the distribution of extreme values, when m=1 and m=n

The maximum to the right element has the distribution F^{n}(x) and the minimumal 1-[1-F(x)]^n. As an example observe order statistics for ranks m=1,2,3 with the sample size n=3 for uniform distribution on the interval [0,1]. Applying the last formula with f(x)=1 (and thus F(x)=x we get the density of the smallest element

\varphi_3 (x_{(1)})=3(1-2x+x^2);

the middle element

\varphi_3 (x_{(2)})=6(x-x^2)

and the maximal

\varphi_3 (x_{(3)})=3x^2.

With full concordance with the intuition, the density of the middle value is symmetric in regard to the parenting distribution, whereas the density of extreme values is bounded by the range of the parenting distribution and increases to a corresponding bound.

Note another interesting property of order statistics. By summing densities  \varphi_3 (x_{(1)}), \varphi_3 (x_{(2)}), \varphi_3 (x_{(3)}) and dividing the result over their number:

\frac{1}{3}\sum\limits_{m = 1}^3 {{\varphi _3}({x_{(m)}}) = \frac{1}{3}(3 - 6x + 3{x^2} + 6x - 6{x^2} + 3{x^2}) = 1 = f(x)}

on the interval [0,1]

The normolized sum of order statistics turned out to equla the parenting distribution f(x). It means that parenting distibution is combination of order statistics X_{(m)}. Just like above had been mentioned that after sorting the general set by ranks we could mix the sorting back together to get the general set.

Further read: Ефимов-1980; Arnord-balakrishnan-2008.

Why so many big lines into terrible restaurants…

It must be a good restaurant since the line is so long. Hm… you are likely just failed to update your beliefs in a rational way.

Imagine you are in a classroom and there is an urn with three balls in front of everyone. You don’t see the colour of balls, but you do know equally likely it could be majority blue (2 blue 1 red) or majority red (1 blue 2 red). Since you don’t know which urn exactly is there (true state of the world) you need some evidence before making a guess. Now every person in class one by one come and pick one ball from the urn and without showing it announces his choice. Believe it or not, but this is your restaurant choice situation.

Two possibilities for the urn is an analogue to whether this restaurant good or bad. A person that comes to make a choice has several pieces of information to combine. Taking one ball from urn is the same as if you have read some review about the restaurant before. The information is not perfect, the reviews could be biased or not representative for your taste. However, you also observed the choices of people before you. You do not know their private signal (what ball they picked from urn, i.e. what was their conclusion after studying the restaurant reviews), but you do know their choices.

Claiming that the restaurant must be good because the line is long would be true only if all people that come sequentially followed only their private signals. Then when your time has come to make a choice the line indicates independent draws of balls from the urn. If it the true state of the world was that the urn is majority blue you would have much more people that say so.

The thing is that those draws are clearly not independent. At some point, a person that has a private signal that states the urn is majority blue might see too many people choosing majority red and he will abandon his private signal and follow the crowd. So that when it is your turn to make a choice and you observe a line (i.e. heaps of people claiming their choice) it does not necessarily mean that the restaurant is good. Put differently, you do not account for correlation of public beliefs (a belief based on the observed choice before seeing your private signal) and private signals.

Well that is herding. And here is a presentation about it….

If that stuff sounded crazy awesome then read this and in the very very end this

It is obviously not about restaurants at all, it could be a choice of major for a college degree. Is being a doctor a good choice or not? There is no way to know for sure, you just have to combine your private signal with the public belief. If you don’t have a strong private belief, then it will be overwhelmed by the public belief and you just follow the crowd. It also could explain why in Russia or Germany during good times aaalll people would put out Nazi flags outside or put Stalin’s portrait on the wall at home and office. Or pretty much anything that involves guessing the state of the world by combining information from your guess and choices of others.

A practical advice on non-parametric density estimation.

Always start from the histogram, any non-parametric density estimation methods are essentially fancier versions of a histogram.

Compare the problem of choosing and optimal size of bins in histogram with choice of h in kernel estimator

The number of bins is too small. Important features, such as mode, of this distribution are not revealed
The number of bins is too small. Important features, such as
mode, of this distribution are not revealed

Optimal number of bins (Optimal according to Sturges' rule, but the rule is besides the point)
Optimal number of bins (Optimal according to Sturges’ rule, but the rule is besides the point)

capture
The number of bins is too large. The distribution is overtted.

The point of the exercise is to reveal all features of data; and that what important to keep in mind.

The bandwidth h is too large. Local features of this distribution are not revealed
The bandwidth h is too large. Local features of this distribution
are not revealed

The bandwidth h is selected by a rule-of-thumb called normal reference bandwidth
The bandwidth h is selected by a rule-of-thumb called normal
reference bandwidth

The bandwidth h is too small. The distribution is overtted.
The bandwidth h is too small. The distribution is overfitted.

 

 

Capture
While histogram takes an average within a bin, kernel estimation naturally extends this idea and takes a fancier version of average around given point. How much info around a point to use is governed by the bandwidth. Conceptually a bandwidth and a bin are identical.

 

And now take a look at a perfect application of the idea in

Nissanov, Zoya, and Maria Grazia Pittau. “Measuring changes in the Russian middle class between 1992 and 2008: a nonparametric distributional analysis.” Empirical Economics 50.2 (2016): 503-530.

Comparison between income distributions in the period 1992–2008. Authors’ calculation on weighted household income data from RLMS. Kernel density estimates are obtained using adaptive bandwidth
Comparison between income distributions in the period 1992–2008. Authors’ calculation on
weighted household income data from RLMS. Kernel density estimates are obtained using adaptive bandwidth

Going back to advice: keep in mind that you doing it to reveal features of data and it has to be strictly more informative than a histogram, otherwise the computational costs are not justified.