Проблема корректного анализа данных блокчейна становится все более острой
Недавно количество добытых биткоинов достигло
17 миллионов – весьма важной вехи для всего криптосообщества. Примерно каждые 10 минут майнеры находят блок транзакций, и сеть добавляет 12.5 новых биткоинов к общему количеству в качестве вознаграждения для майнеров. И каждое вознаграждение регистрировалось в блокчейне, с тех пор как биткоин был запущен в 2009 году.
Однако в то время как некоторые отмечали важное для сообщества событие, подтвержденное платформой Blockchain.info, самым популярным поставщиком данных о Биткоине, другие отправились в социальные сети, чтобы добавить свою ложку дегтя в общую бочку меда. Джеймсон Лопп (Jameson Lopp), инженер Casa и создатель Statoshi.info, одного из обозревателей блокчейна Биткоина, написал в своем Твиттере:
«Сегодня я узнал, что многие источники данных неверно сообщают об общем количестве биткоинов. На самом деле мы еще не достигли цифры в 17 миллионов BTC».
Утверждение Лоппа базировалось на том, что Blockchain.info, один из самых популярных поставщиков данных блокчейна, не учитывал случаи, когда майнеры биткоина из-за ошибок или по другим причинам не получали полного вознаграждения за блок. В результате были безвозвратно потеряны около 150 BTC (которые сейчас добываются за 12 блоков, т. е. в среднем за 2 часа)
К сожалению, эти расхождения в общей метрике количества биткоинов являются не исключением, а частью более крупной проблемы, которая проистекает из «непрозрачных» методологий, используемых компаниями, анализирующими данные блокчейна. Это утверждает Грег Чиполаро (Greg Cipolaro), генеральный директор Digital Asset Research (DAR) – компании, которая осуществляет анализ блокчейна для своих клиентов.
DAR поставила перед собой цель исследовать методы платформы Blockchain.info, чтобы раскрыть «одну из самых старых тайн криптовалютного сообщества» – расчетную стоимость транзакции биткоина. В опубликованном недавно отчете компании по этому вопросу DAR заявила о чрезмерно высокой оценке стоимости транзакций на платформе Blockchain с октября по февраль 2018 года.
Однако речь идет не только о Blockchain. Циполаро отметил, что в январе сервис CoinMarketCap удалил без предупреждения данные южнокорейских бирж из индекса цен. Поскольку цены на криптовалюты на южнокорейских биржах как правило выше, их исключение из индекса создало впечатление обвала криптовалютных рынков. На фоне паники началась активная торговля, которую Циполаро назвал «молниеносным мини-обвалом».
Однако справедливости ради стоит отметить, что на индексы цен всегда влияют субъективные решения. Это относится не только к криптовалютам, но и к фондовому рынку. Но без понимания того, каким образом формируется цена и другие показатели, криптовалютное сообщество может серьезно пострадать. Точные данные чрезвычайно важны для инвесторов, трейдеров, пользователей, разработчиков, ученых, журналистов – практически для всех.
Разносторонняя проблема
Многие люди, зависящие от данных открытых блокчейнов, по-прежнему не понимают, насколько ошибочной порой бывает эта информация. Стефан Рихтер (Stefan Richter), специалист по информатике, предлагает весьма мрачный взгляд на текущее состояние индустрии анализа блокчейна. В прошлом Рихтер был сооснователем поставщика данных BitcoinPrivacy. Он отмечает, что «программные ошибки вероятно присутствуют в каждом существующем обозревателе».
Циполаро соглашается с этим утверждением и отмечает, что подобные ошибки сложно заметить, «пока не потратишь достаточно времени на их поиск». К счастью, некоторые энтузиасты индустрии все же смогли их обнаружить. Один из них – Лопп. Он указал на подсчет узлов Биткоина, количество которых часто упоминается как фактор, подтверждающий децентрализацию и работоспособность сети.
«Я часто слышу, как люди говорят, что есть только 10 000 узлов Биткоина», – говорит Лопп. «Однако источник этих данных – Bitnodes, «учитывает только доступные узлы, которые принимают входящие соединения».
Эдди Иов (Addy Yeow), создатель Bitnodes, подтвердил, что сайт учитывает только узлы, принимающие сигналы. Получается, что общее количество узлов может быть намного выше. Действительно, согласно одной из оценок, если подсчитать все узлы – как принимающие, так и не принимающие сигналы, то их набирается около 140 000.
И в то время как Иов соглашается с этой оценкой, он предупреждает, что добавление узлов, которые не принимают сигнал к метрике, потребует ухода в область построения догадок. Он объяснил, что источники данных, которые подсчитывают подобные узлы, фактически занимаются лишь предположениями. Такие узлы могут находиться за файерволом, изменить IP-адреса или же быть полностью отключены.
Платформы, анализирующие блокчейн, которые принимают в расчет подобные узлы, используют формулу, учитывающую количество дней, когда узлы не принимали сигнал в попытке их подсчитать. Однако, чем больше невидимых, но подключенных узлов они обнаруживают, тем больше отключенных узлов они включают в метрику по ошибке.
Решение близко
Из-за проблем с открытыми наборами данных многие специалисты избегают их использования и вместо этого опираются на информацию, которую они собирают своими силами.
Chainalysis – фирма, которая анализирует данные блокчейнов для клиентов, включая Налоговую службу США (IRS), придерживается такой позиции. Кимберли Грауэр (Kimberley Grauer), главный экономист Chainalysis, сказала, что предпочитает использовать собственные данные, так как знает «какие из них могут быть ошибочными или ненадежными». Циполаро из DAR соглашается с этой позицией и отмечает, что компания запускает собственный код, собирая данные из собственного узла сети Биткоина.
При этом, несмотря на их недостатки, Циполаро высоко оценил бесплатные сайты, которые публикуют данные Биткоина для общественности.
Очевидно, что все эти компании действительно делают все возможное для предоставления наиболее точных данных. Когда из-за ошибки
в веб-сервисе Blockchain.info появилась неверная информация о том, что основатель Биткоина Сатоши Накамото переместил несколько монет, компания быстро исправила
проблему.
Некоторые проблемы достаточно легко исправить. Грауэр отметила, что обозреватели блокчейна часто не учитывают часовые пояса. Хотя это не критично, но все же вызывает определенные недоразумения.
В других наборах данных не так просто разобраться. Хотя блокчейн Биткоина общедоступен, измерение стоимости транзакций может быть довольно сложной задачей. Даже в DAR не утверждают, что их новый метод является абсолютно точным.
В настоящее время сообществу нужно помнить о старой русской пословице, переиначенной шифропанками: «Доверяй, но верифицируй».