summarization و aggregation با استفاده از توابع DAX

تجمیع و خلاصه کردن داده ها یا به عبارت دیگه aggregation و summarization از جمله کارهای پر تکرار کار با دادست که ابزارها و روش های و کدهای مختلفی وجود داره. در مجموعه توابع DAX به طور اختصاصی به غیر از امکان aggregation در ویزوال ها امکان اضافه کردن جداول در قابل جداول تجمیعی یا ستون ها وجود داره که برای محاسبات چند سطحی بسیار پر کاربرد هستن. در این پست به چند مورد در قالب مثال های آموزشی اشاره می کنم.

در مجموع مهم ترین این توابع عبارتند از summarize، summarizecolumns و groupby که در ادامه توضیح مختصری داده میشه. داده های مثال عبارتند از :

Price	Quantity	ProductGroup
1000	10	Group-A
1000	20	Group-A
1000	30	Group-A
1000	40	Group-A
1000	50	Group-B
2000	60	Group-B
2000	70	Group-B
2000	80	Group-C
2000	90	Group-C
2000	100	Group-C

نام جدول فوق رو data گذاشته ام. همه کدهای مثال های زیر در یک new table استفاده می شود. چون خروجی توابع زیر جدول خواهند بود البته می تونید در متغیر ها هم استفاده کنید.

تابع SUMMARIZE

1	تابع SUMMARIZE

شکل کلی تابع به این صورته :

SUMMARIZE (&lt;table&gt;, &lt;groupBy_columnName&gt;[, &lt;groupBy_columnName&gt;]…[, &lt;name&gt;, &lt;expression&gt;]…)

1	SUMMARIZE (<table>, <groupBy_columnName>[, <groupBy_columnName>]…[, <name>, <expression>]…)

که به ترتیب نام جدول و ستونی اولی که قراره براساس اون گروه بندی بشه و ستون های بعدی برای گروه بندی آورده میشه (جدول و ستون اول اجباریه و مابقی اختیاری). بعد از نام ستون ها، نام ستون یا ستون هایی که قراره خروجی aggregation رو در اون داشته باشیم در داخل “” قرار می دهیم و در آخر پس از نام تابع aggregation مثله sum یا max رو قرار می دهیم. این روند تقریبا در همه این سه تابع مشابه است با کمی تفاوت.

به طور مثال مجموع و میانگین گروه های جدول مثال بالا را به این صورت محاسبه می کنیم :

1-summarize =
SUMMARIZE (
    data,
    data[ProductGroup],
    "Sum of quantity", SUM ( data[Quantity] ),
    "Average of quantity", AVERAGE ( data[Quantity] )
)

1-summarize =

SUMMARIZE (

data,

data[ProductGroup],

"Sum of quantity", SUM ( data[Quantity] ),

"Average of quantity", AVERAGE ( data[Quantity] )

)

خروجی :

اگر بخواهیم همین اطلاعات رو برای گروه های با قیمت بالای 1000 محاسبه کنیم پاسخ به این صورت خواهد شد :

2-summarize-fiter =
SUMMARIZE (
    FILTER ( data, data[Price] &gt; 1000 ),
    data[ProductGroup],
    "Sum of quantity", SUM ( data[Quantity] ),
    "Average of quantity", AVERAGE ( data[Quantity] )
)

2-summarize-fiter =

SUMMARIZE (

FILTER ( data, data[Price] > 1000 ),

data[ProductGroup],

"Sum of quantity", SUM ( data[Quantity] ),

"Average of quantity", AVERAGE ( data[Quantity] )

)

خروجی :

البته هم میشه جدول ورودی به تابع رو فیلتر کرد هم این که فیلتر رو در هنگام محاسبات جدول اعمال کرد با استفاده از تابع CALCULATETABLE به این صورت خواهد شد :

3-summarize-fiter-calculatetable =
CALCULATETABLE (
    SUMMARIZE (
        data,
        data[ProductGroup],
        "Sum of quantity", SUM ( data[Quantity] ),
        "Average of quantity", AVERAGE ( data[Quantity] )
    ),
    data[Price] &gt; 1000
)

3-summarize-fiter-calculatetable =

CALCULATETABLE (

SUMMARIZE (

data,

data[ProductGroup],

"Sum of quantity", SUM ( data[Quantity] ),

"Average of quantity", AVERAGE ( data[Quantity] )

data[Price] > 1000

)

خروجی هم که دقیقا خروجی بالا خواهد شد.

تابع SUMMARIZECOLUMNS

1	تابع SUMMARIZECOLUMNS

تابع بعدی SUMMARIZECOLUMNS، که میشه گفت ورژن جدیدتر و البته پرسرعت تر تابع SUMMARIZE و البته تابع GROUPBY هستش. چند تفاوت بین این تابع با SUMMARIZE وجود داره تابع SUMMARIZECOLUMNS جدولی به عنوان ورودی دریافت نمیکنه و ستون های مورد نظر برای گروه بندی رو از جداول مختلف میتونه دریافت کنه و لزومی به ورود جدولی برای این کار نیست همچنین همونطور که در شکل کلی تابع می بینید تابع امکان دریافت پارامتری به عنوان جدول فیلتر رو داره. شکل کلی تابع :

SUMMARIZECOLUMNS( &lt;groupBy_columnName&gt; [, &lt; groupBy_columnName &gt;]…, [&lt;filterTable&gt;]…[, &lt;name&gt;, &lt;expression&gt;]…)

1	SUMMARIZECOLUMNS( <groupBy_columnName> [, < groupBy_columnName >]…, [<filterTable>]…[, <name>, <expression>]…)

اما اگه بخواهیم دو مثال بالا رو با این تابع حل کنیم کدها عبارت خواهند بود از :

1-summarizecolumns =
SUMMARIZECOLUMNS (
    data[ProductGroup],
    "Sum of quantity", SUM ( data[Quantity] ),
    "Average of quantity", AVERAGE ( data[Quantity] )
)

1-summarizecolumns =

SUMMARIZECOLUMNS (

data[ProductGroup],

"Sum of quantity", SUM ( data[Quantity] ),

"Average of quantity", AVERAGE ( data[Quantity] )

)

2-3-summarizecolumns =
SUMMARIZECOLUMNS (
    data[ProductGroup],
    FILTER ( data, data[Price] &gt; 1000 ),
    "Sum of quantity", SUM ( data[Quantity] ),
    "Average of quantity", AVERAGE ( data[Quantity] )
)

2-3-summarizecolumns =

SUMMARIZECOLUMNS (

data[ProductGroup],

FILTER ( data, data[Price] > 1000 ),

"Sum of quantity", SUM ( data[Quantity] ),

"Average of quantity", AVERAGE ( data[Quantity] )

)

تابع GROUPBY

1	تابع GROUPBY

ولی در آخر تابع GROUPBY که ساختار کلیش کمی متفاوته. در کل میشه گفت فرق اساسی این تابع با دو تابع قبل انجام چند لایه aggregation هستش که این امکان رو میده که در یک مجموعه کد تو در تو یا nested محاسبات تجمیعی صورت بگیره. همچنین در این تابع از توابع xFunctions یا iterators مثل SUMX استفاده میشه که فرقشون با توابع معمولی مثه SUM ، امکان سطر به سطر محاسبه کردن و لوپ زدن بین رکورد هاست. به طور مثال با SUMX ابتدا میشه ستون قیمت و تعداد رو نظیر به نظیر ضرب و سپس حاصل ضرب مقادیر رو جمع کنید. توجه کنید این با جمع یک ستون و ضرب در جمع ستون دیگه متفاوته! پس این دو رو میشه از مهم ترین مزیت های این تابع به حساب اورد و البته که محاسبات پیچیده تر و زمان بیشتری میبره برای ارایه خروچی! شکل کلی تابع به این صورته :

GROUPBY (&lt;table&gt; [, &lt;groupBy_columnName&gt; [, &lt;groupBy_columnName&gt; [, …]]] [, &lt;name&gt;, &lt;expression&gt; [, &lt;name&gt;, &lt;expression&gt; [, …]]])

1	GROUPBY (<table> [, <groupBy_columnName> [, <groupBy_columnName> [, …]]] [, <name>, <expression> [, <name>, <expression> [, …]]])

مثال اول رو اگه بخواهیم با این تابع حل کنیم به این صورت خواهد شد (به عبارت CURRENTGROUP دقت کنید که اشاره به گروه بندی خود تابع GROUPBY داره)

1-groupby =
GROUPBY (
    data,
    data[ProductGroup],
    "Sum of quantity", SUMX ( CURRENTGROUP (), data[Quantity] ),
    "Average of quantity", AVERAGEX ( CURRENTGROUP (), data[Quantity] )
)

1-groupby =

GROUPBY (

data,

data[ProductGroup],

"Sum of quantity", SUMX ( CURRENTGROUP (), data[Quantity] ),

"Average of quantity", AVERAGEX ( CURRENTGROUP (), data[Quantity] )

)

در پست های بعد در مورد این تابع بیشتر مثال خواهم زد.

۱ دیدگاه. ترک جدید

ریاضی

۴ اسفند, ۱۴۰۱ ۶:۳۳ ق.ظ

درود بر شما ؛ مطلب مفیدی بود . سپاس.

پاسخ

summarization و aggregation با استفاده از توابع DAX

۱ دیدگاه. ترک جدید

دیدگاهتان را بنویسید لغو پاسخ

مطالب جدید

SQL Server Query Tuning and Optimization Optimize Microsoft SQL Server 2022 queries and applications

SQL Server Advanced Troubleshooting and Performance Tuning: Best Practices and Techniques

Building Custom Tasks for SQL Server Integration Services

نحوه اجرا دستورات در SSAS از طریق SQL Server

روش های پر کردن مقادیر NULL با استفاده از مقادیر موجود در رکوردهای قبلی

دسته‌ها

بایگانی

آمار بازدید

درباره وبلاگ

نوشته‌های تازه

ابرچسب ها