Пост телеграм-канала PPC для сверхразумов | Александр Хитро
PPC для сверхразумов | Александр Хитро
20 окт. 2023 года в 11:12
Сделал наконец вчера то, что не мог заставить себя сделать 2,5 года.
1️⃣ Собрал из всех своих предыдущих проектов список из 5000 добавок к фразам:
✅️ Разные виды топонимов (города, области, районы РБ и РФ, страны)
✅️ Разные виды горячих добавок (ценовые, рассрочковые, оптовые, производственные, низко- и высокочековые, рассчётные, арендовые и т.д.)
✅️ Разные виды информационных добавок
✅️ Разные виды добавок на ранних этапах спроса
✅️ Список EN и RU стоп-слов
Теперь можно в одно действие:
— Удалять и извлекать их из семантики
— Промечать их смысловыми ярлыками во фразах и списке униграмм
— Использовать их как критерии фильтрации и группировки
***
2️⃣ Написал регулярки для извлечения из списка униграмм одной функцией целого ряда паттернов:
✅️ Чисел, состоящих от 1 до 13 цифр и более.
✅️ Круглых чисел от 2 до 5 цифр, которые заканчиваются на 0, 00, 000.
Пример:
20, 200, 2000, 20000.
✅️ Чисел от 2 до 5 цифр, которые заканчиваются не на 0.
Пример:
12, 123, 1234, 12345.
✅️ Чисел от 6 цифр и более.
✅️ Числовых униграмм, которые начинаются с 0.
Пример:
01, 0123, 000001, 000000115.
✅️ Одногабаритных униграмм, которые заканчиваются на "м", "m", "метра", "метров".
Пример:
5м, 50m, 3метра, 50метров.
✅️ Одногабаритных униграмм, которые заканчиваются на "мм", "mm".
Пример:
80мм, 900мм, 80mm, 900mm.
✅️ Одногабаритных униграмм, которые заканчиваются на "см", "cm".
Пример:
80см, 900см, 80cm, 900cm.
✅️ Двухгабаритных униграмм, пишущихся либо через русскую "х", либо через английский "x", либо через предлог "на", и которые в любом месте могут содержать любое название габарита.
Пример:
50на50, 5на5м, 50на50, 50cmх50cm, 50x500mm, 50х50мм, 500x50cm, 500mmx1000mm.
✅️ Трёхгабаритных униграмм, пишущихся либо через русскую "х", либо через английский "x", либо через предлог "на", и которые в любом месте могут содержать любое название габарита.
Пример:
500x500x10, 50x50x1000, 1000х500х50см, 500на500на5мм, 500x1000x100mm.
✅️ Униграмм, которые содержат в любой части строки кириллицу или латиницу в сочетании с цифрами в любом порядке их следования друг за другом и любом количестве повторений подряд.
Пример:
s1, 1s, ssss1111, 1111ssss, ss11ss11s1, в1, 1в, вввв1111, 1111вввв, 11вв11вв1в.
***
3️⃣ Создал библиотеку, обнаружил в ней одной формулой с регулярками все эти значения, заменил их регулярками на смысловые ярлыки.
Теперь это универсальный шаблон для обнаружения их в любом проекте, где в ключах и поисковых запросах есть любые числа, размеры, их комбинации и габариты, номенклатура и модели со вхождением цифр.
На реальной семантике в 200 тысяч униграмм из выгрузки Букварикса двумя формулами обнаружил и заменил на смысловые ярлыки 80 тысяч значений.
За одну минуту.
Перенесу всё это в Power Query — и эта операция будет выполняться с любым проектом в одно действие.
***
4️⃣ Собираю на стримах в режиме реального времени автоматизированный шаблон в Power Query для:
✅️ Обработки и анализа ключей, запросов, выгрузок из различных сервисов.
✅️ Пословного и пофразового сравнения ключей и запросов.
✅️ Приоритизации сегментов лексики.
✅️ Создания огромного количества неочевидных срезов.
✅️ Интерактивной фильтрации 1-gram анализа.
✅️ Разворачивания униграмм не до списка фраз, как в анализе групп KeyCollector, а сначала до извлеченных из фраз категорий, топонимов, брендов, горячих и инфо добавок, и только потом до фраз.
✅️ Динамики изменения показателей по каждой униграмме в любой группировке дат.
✅️ Фильтрации поисковых запросов вайтлистом.
✅️ Фильтрации только новых слов и фраз (без учета порядка слов), которые раньше не встречались в запросах.
✅️ Фильтрации 1-gram анализа датами, РК, группами, ключами, брендами, категориями, урлами.
✅️ Создания кастомных атрибутов для их использования как критериев фильтрации и группировки в 1-gram анализе и фразах.
Будет пушка-бомба-торпеда.
Подробнее о комбайне:
— Пост 1
— Пост 2
— Пост 3
— Пост 4
Если хотите обращаться с семантикой эффективнее, велкам в чатик — покажу, как это всё применять, в т.ч. на иностранных языках.
————
Топ постов @ppc_bigbrain: