x

Psst. It's better sideways.

(Try me in landscape!)

تور الگوریتم ها

چگونه علم داده در بافت Stitch Fix بافته شده است

log p 1   -   p = α   +   +   Zb ... min i j a Σ   Σ a ij q ij s.t. a ij   =  1  i j Σ a ij     { 0,1 } i,j a ij   <  k j   j i Σ x t ( x ,  u ,  w )   p ( i → j ) =  logit  (  β 0   +  β x 1  ...  ) p   (   1   )   =  β ex_cell +  α p   (   1 |  stylist   ) +  α p   (   1 |  client   ) ... ... ... c i s j

در Stitch Fix ، ما در حال تغییر شیوه ای هستیم که مردم آنچه را که دوست دارند پیدا می کنند. مشتریان ما لباسهای کاملی را برای ترجیحات شخصی خود می خواهند - در عین حال بدون بار جستجو یا مجبور بودن با روندهای فعلی. کالای ما از این سایت تهیه شده است بازار و با طرح های خود ما برای پر کردن شکاف ها تقویت شده است. در حال حاضر و بسیار گسترده و متنوع است - چیزی را برای همه تضمین می کند. داده های غنی در هر دو طرف این "بازار" Stitch Fix را قادر می سازد تا یک همساز باشد و مشتریان را به هم متصل کند با سبک هایی که دوست دارند (و هرگز به تنهایی پیدا نمی شوند).

مدل تجاری ما علم داده های بی سابقه ای را قادر می سازد ، نه تنها در سیستم های توصیه ، بلکه در محاسبات انسانی ، مدیریت منابع ، مدیریت موجودی ، طراحی مد الگوریتمی و بسیاری از زمینه های دیگر. آزمایش و توسعه الگوریتم عمیقا در همه کارهایی که Stitch Fix انجام می دهد ، عمیقاً جا افتاده است. در ادامه حرکت چند نمونه را به تفصیل شرح می دهیم.

بنابراین داده ها چگونه به نظر می رسند؟ علاوه بر داده های بازخورد غنی که از مشتریان خود دریافت می کنیم ، ما همچنین مقدار زیادی اطلاعات اولیه در مورد لباس و مشتریان خود دریافت می کنیم. خریداران و طراحان ما جزئیات ابعاد و سبک و مشتریان ما را جذب می کنند هنگام ثبت نام یک پروفایل پر کنید تا با کمترین تلاش مشتری ، مفیدترین اطلاعات را در اختیار ما قرار دهد.

بیایید ابتدا با پر کردن درخواست حمل و نقل ، تعدادی از الگوریتم های زیادی را که در این فرایند نقش دارند ، قبل از بزرگنمایی برای مشاهده تصویر بزرگتر ، مشاهده کنید.

تجربه مشتری قسمت 1: مشخصات و درخواست

همانطور که اشاره شد ، هنگامی که یک مشتری برای اولین بار ثبت نام می کند ، یک Style Profile را پر می کند (در هر زمان می توان آن را به روز کرد). سپس ، برنامه ریزی تحویل آسان است: یک الگوریتم برای تنظیم تقویمی که او تاریخ تحویل را از آن انتخاب می کند ، استفاده می شود.

واگذاری انبار

درخواست حمل و نقل توسط یک الگوریتم پردازش می شود که آن را به یک انبار اختصاص می دهد. این الگوریتم یک تابع هزینه برای هر انبار را بر اساس ترکیبی از موقعیت آن نسبت به سرویس گیرنده و میزان موجودی های مختلف در محاسبه می کند. انبارها با نیازهای مشتری مطابقت دارد.

این مجموعه از محاسبات هزینه برای هر مشتری برای تولید یک ماتریس هزینه انجام می شود.

تخصیص مشتریان به انبارها یک مشکل بهینه سازی باینری است.

و بهینه جهانی شامل واگذاری انبار این مشتری خاص است.

سپس درخواست حمل و نقل به الگوریتم حالت دهی Humans + Machines هدایت می شود.

ماشینهای هوشمند

ابتدا ، ماشین ها انواع مختلفی از الگوریتم ها را برای تهیه فهرست مرتب شده موجودی انجام می دهند.

یک مرحله فیلترینگ سبک هایی را که مشتری در محموله قبلی دریافت کرده یا دارای ویژگی هایی است که مشتری از آنها اجتناب کرده است حذف می کند.

سپس برای هر یک از سبک های باقی مانده ، ماشین ها سعی می کنند احتمال نسبی این مشتری خاص را دوست داشته باشند. این یک مشکل دشوار است و ما به روشهای مختلف به آن نزدیک می شویم - که تنها در مورد برخی از آنها بحث خواهیم کرد اینجا. اما به طور کلی ، توجه داشته باشید که ما هر مورد را چندین بار با نمرات مطابقت از الگوریتم های مختلف برچسب گذاری می کنیم و سپس آنها را رتبه بندی می کنیم.

از برخی جهات ، مشکل یک مشکل فیلترینگ مشارکتی کلاسیک است: با توجه به بازخورد مشتریان مختلف در مورد سبک های مختلف ، ما باید فاصله های ماتریس (پراکنده) را پر کنیم تا نتیجه ارسال یک سبک به مشتری را که هنوز دریافت نکرده است پیش بینی کنیم. آی تی. به این ترتیب ، ما انجام دادن از برخی الگوریتم های استاندارد فیلترینگ مشارکتی استفاده کنید (به عنوان مثال کسانی که آنچه را که شما دوست داشته اید دوست داشته اند نیز دوست داشته اند ...).

با این حال ، برخلاف اکثر مشکلات فیلترینگ مشارکتی ، ما اطلاعات صریح زیادی داریم ، هم از توصیفات خود مشتریان و هم از ویژگی های لباس. این به مشکل شروع سرد کمک می کند و همچنین در صورت استفاده از الگوریتم ها ، دقت بیشتری را امکان پذیر می کند که این داده ها را در نظر بگیرند

یکی از این رویکردها مدل سازی با اثرات ترکیبی است که به دلیل ماهیت طولی مشکل ما بسیار مفید است: به ما این امکان را می دهد تا ترجیحات مشتریان خود را در طول زمان ، هم به صورت جداگانه و هم به طور کلی (یاد بگیریم).

و علاوه بر بسیاری از ویژگیهای آشکار موجود ، برخی از ویژگیهای نهفته (بیان نشده) مربوط به مشتریان و سبکها وجود دارد که می توانیم از داده های دیگر (ساختار یافته و/یا بدون ساختار) استنباط کنیم و از آنها برای بهبود عملکرد خود استفاده کنیم.

به عنوان مثال ، یک مشتری جدید ممکن است به ما بگوید که از بلوزهای متوسط ​​استفاده می کند ، اما ترجیحات او دقیقاً در طیف رسانه های کوچک و متوسط ​​بیشتر قرار می گیرد؟ همین س alsoال در مورد سبک های خاص لباس موجودی ما نیز صدق می کند. (توجه داشته باشید که در این تصویر ما سادگی را از نظر سادگی بی اندازه می دانیم ، اما در واقع در Stitch Fix ما آن را چند بعدی می دانیم.)

با بازخورد مناسب مشتریان و سابقه خرید ، می توانیم بیاموزیم که مشتریان و سبک های خاص در این طیف قرار می گیرند. این ویژگیهای نهفته را می توان در مدلهای اثرات مختلط ما و جاهای دیگر استفاده کرد.

اگر مشکل خود را فراتر از فیلترینگ کلاسیک مشارکتی پیش ببریم ، ما همچنین داده های عکاسی و متنی زیادی داریم که باید در نظر بگیریم: عکس های سبک موجودی ، تخته های Pinterest ، و مقدار زیادی از بازخورد و یادداشت های درخواست ما از مشتریان

گاهی اوقات توصیف ترجیحات سبک شما با کلمات دشوار است ، اما وقتی آن را می بینید این را می دانید - بنابراین ما دستگاه های خود را به عکس هایی از لباس هایی که مشتریان دوست دارند (مثلاً از Pinterest) نگاه می کنیم و مواردی را که از لحاظ بصری مشابه هستند در موجودی خود جستجو می کنیم. به ما از شبکه های عصبی آموزش دیده برای به دست آوردن توصیف بردار تصاویر "سنجاق شده" استفاده می کنیم و سپس شباهت کسینوس بین این بردارها و بردارهای از پیش محاسبه شده برای هر مورد موجودی خود را محاسبه می کنیم.

پردازش زبان طبیعی برای نمره گذاری موارد بر اساس یادداشت درخواست مشتری و بازخورد متنی سایر مشتریان در مورد همان مورد استفاده می شود.

همه این نمرات الگوریتم - و بسیاری دیگر مانند آنها - هنگام سفارش و ارائه گزینه هایی که برای متخصص سبک انسان باید در نظر گرفته شود ، در نظر گرفته می شود.

همسریابی

هنگامی که این رتبه بندی ماشین کامل شد ، درخواست حمل و نقل به یک انسان منتقل می شود.

انسانها ناهمگن تر از ماشینها هستند. همه دستگاهها یکسان هستند - فقط یکی را انتخاب کنید. اما سبک های انسانی برای برخی از مشتریان بیشتر از سایرین مناسب خواهند بود. بنابراین ما از الگوریتم ها برای بهینه سازی این تطابق استفاده می کنیم.

برای انجام این کار ، ابتدا نمره مسابقه را بین هر استایلیست موجود و هر مشتری که در طول دوره جاری درخواست محموله کرده است محاسبه می کنیم. این نمره بازی تابع پیچیده ای از تاریخ بین آن مشتری و صاحب سبک (در صورت وجود) و خویشاوندی ها است بین ترجیحات سبک اعلام شده و پنهان مشتری و سبک کار.

متعاقباً ، مشکل بهینه سازی تعیین سبک شبیه مشکل واگذاری انبار است که در بالا توضیح داده شد ، با این تفاوت که (الف) فقط باید مشتریانی را که منتظر ارسال هستند در نظر بگیرد و (ب) باید مساله بهینه سازی را بسیار بیشتر اجرا کنیم اغلب برای اندازه های مختلف صف آرایشگران در هنگام کار آنها حساب می شود.

انسانهای هوشمند با ابزارهای هوشمند

در حالی که ماشین ها برای انجام محاسبات روزمره عالی هستند ، وظایف دیگری نیز وجود دارد که نیاز به بداهه نوازی ، آگاهی از هنجارهای اجتماعی و توانایی ارتباط با مشتریان دارد. این وظایف در اختیار انسان است. اینجاست که استایلیست های ما اجرا می کنند نوع محاسبه ای که فقط انسان می تواند انجام دهد.

برای شروع طراحی یک محموله ، یک سبک کار را در رابط کاربری سفارشی طراحی می کند تا به او کمک کند تا مشتری را سریع و عمیق درک کند.

تیم محاسبات انسانی ما آزمایشات زیادی را با تغییرات این رابط انجام می دهد و به ما کمک می کند تا نحوه تصمیم گیری سبک شناسان را درک کنیم.

این دانش به طرق مختلف به ما کمک می کند: برای بهبود سبک الگوریتمی خود ، برای بهبود روش های آموزش سبک ما و به طور مداوم رابط کاربری که سبک ها برای انتخاب جعبه ها استفاده می کنند.

در نهایت ، آرایشگر انتخاب ها را از لیست موجودی نهایی می کند و یک یادداشت شخصی می نویسد که شرح می دهد چگونه مشتری می تواند اقلام را برای یک مناسبت خاص مورد استفاده قرار دهد و/یا چگونه می تواند آنها را با لباس های دیگر در کمد خود ست کند.

این روش یک ظاهر طراحی شده را به پایان می رساند و محموله اکنون آماده پردازش است.

لجستیک هوشمند

در این مرحله پردازش مشکلات مختلف عملیات تحقیقاتی یافت می شود.

به عنوان مثال ، با توجه به موارد انتخاب شده برای حمل و نقل ، بهترین راه برای جمع آوری کنندگان از انبار برای پر کردن جعبه کدام است؟

این مشکل در مسیریابی مسیر انتخاب نمونه ای از مشکل فروشنده مسافر NP-hard است. در عمل ، ما حتی مشکل را یک قدم جلو می بریم تا گروه بندی بهینه محموله ها را که می توان همزمان انتخاب کرد ، بررسی کنیم.

سپس محموله تا تاریخ تحویل درخواستی به مشتری تحویل داده می شود.

تجربه مشتری قسمت 2: تلاش برای بازخورد و بازخورد

اما این تازه شروع کار است.

او جعبه را باز می کند ، امیدوار است خوشحال باشد ، آنچه را که می خواهد نگه می دارد و می فرستد ، سپس استراحت می کند و سپسبه ما می گوید که در مورد هر نوع لباس چه نظری دارد.بین او و Stitch Fix رابطه همزیستی وجود دارد و او بازخورد بسیار روشنی به ما می دهد که ما نه تنها برای خدمت بهتر در دفعات بعدی ، بلکه برای خدمات رسانی بهتر به سایر مشتریان نیز از آن استفاده می کنیم.

دا کاپو الکودا

برای جمع آوری مجدد فرایند پر کردن یک درخواست حمل و نقل: یک مشتری یک Style Profile ایجاد می کند و درخواست حمل می کند ، ما آنها را با یک انبار مطابقت می دهیم ، الگوریتم های استایل ما و استایلیست های انسانی برای انتخاب سبک ها با هم کار می کنند ، سبک نویس یادداشتی می نویسد ، ما محموله را تحویل دهید ، و مشتری آنچه را که دوست دارد نگه می دارد ، بقیه را برمی گرداند و بازخورد را برای ما ارائه می دهد.

اما این فقط یک محموله است. با بزرگنمایی ، می توانیم سیستم را به عنوان یک کل در نظر بگیریم. در این سطح ، دو جنبه دیگر از کسب و کار روشن می شود:

(1) ما باید مرتباً موجودی خود را با خرید و/یا طراحی لباس جدید برای مشتریانمان پر کنیم ، که فرصتی عالی برای استفاده از داده های غنی ما فراهم می کند.

(2) ما باید نیازهای مشتریان خود را پیش بینی کنیم تا مطمئن شویم که منابع کافی کافی را در زمان مناسب در اختیار داریم.

بیایید ابتدا نحوه پیش بینی نیازهای مشتریان خود را بررسی کنیم ، سپس به بررسی مدیریت موجودی و توسعه سبک جدید می پردازیم.

ماشین های دولتی

یکی از راه هایی که ما به این مشکل پیش بینی نیازها (و مشکلات مربوط به آن) نگاه می کنیم این است که "وضعیت" هر مشتری را در هر مقطع زمانی در نظر بگیریم. آیا آنها مشتری جدیدی هستند؟ آیا آنها از طریق مراجعه یا خود به خود رسیده اند؟ کمد آنها تقریبا پر شده است؟ هستند آنها در مرحله ایجاد کمد لباس بعد از تغییر زندگی؟ یا به سادگی می خواهید چیز جدیدی را امتحان کنید؟ بسته به وضعیت آنها ، آنها احتمالاً دارای سرعت ارسال متفاوت ، خواسته های متفاوت برای تماس با ایمیل و غیره خواهند بود.

ما هر نقطه لمسی را که با هر مشتری داریم - هر موردی که ارسال می کنیم ، هر بازخوردی که دریافت می کنیم ، هر ارجاعی ، هر ایمیل و غیره - پیگیری می کنیم.

با استفاده از این داده ها ، ما سعی می کنیم حالات مشتریان و نیازهای آنها را در شرایط مختلف درک کنیم. سپس می توانیم تغییرات در وضعیت را تشخیص داده و محرک های احتمالی را در نظر بگیریم. این فرآیند به خودی خود می تواند به بینش هایی منجر شود که به ما کمک می کند مشتریان خود را راضی تر نگه داریم.

و هنگامی که حالات را تعریف و درک می کنیم ، و انتقال مشتری را بین آنها تشخیص داده و درک می کنیم ، می توان ماتریس های انتقال حالت و مدل های زنجیره ای مارکوف را ایجاد کرد که به ما امکان می دهد تا اثرات سطح سیستم را مطالعه کنیم.

مدل سازی تقاضا

یکی از موارد متعدد استفاده از این مدل های زنجیره ای مارکوف ، پیش بینی تقاضای آینده است ، که بسیار مهم است زیرا ما اغلب ماه ها قبل از رسیدن به انبارها به خرید موجودی نیاز داریم. ما همچنین باید اطمینان حاصل کنیم که تعداد مناسب منابع و آرایشگران انسانی در زمان مناسب در دسترس هستند.

مدیریت موجودی

اتمام موجودی از طریق تقاضای مشتری در نهایت باید با خرید موجودی جدید جبران شود. یکی از چالش ها در زمان بندی مناسب برای خرید است ، به طوری که ما موجودی کافی را برای سبک شناسان حفظ کرده و در عین حال خرید را به حداقل برسانیم. مجموع هزینه های سفارش و هزینه های حمل (هزینه های عملیاتی و هزینه های فرصت سرمایه مرتبط با منطقه زیر منحنی موجودی).

برآوردن تقاضای آینده تنها یکی از چالش های مدیریت موجودی ما است: ما همچنین باید موجودی را به طور مناسب به انبارهای مختلف اختصاص دهیم و گهگاه موجودی قدیمی را اهدا کنیم تا فضا برای سبک های جدید باز شود. ما می توانیم از الگوریتم ها برای کمک به این موارد استفاده کنیم فرآیندها

(توجه داشته باشید که وضعیت پیچیده تر از این تصویر ساده است ، زیرا ما باید به بررسی انواع و اقسام لباس های مختلف در هر یک از انبارها بپردازیم. اما برای نظافت به تصاویر ساده در اینجا می پردازیم.)

چقدر از چه سبک هایی بخریم؟ کدام اقلام باید به کدام انبار برود؟ چه موجودی باید در چه زمانی اهدا شود؟

ما با استفاده از مدلی از پویایی سیستم ، برازش آن با داده های تاریخی و استفاده از آن برای بهینه سازی قوی با توجه به عدم قطعیت های کمی در پیش بینی های ما ، به این س questionsالات پاسخ می دهیم

توسعه سبک جدید

چالش های حجمی تنها ملاحظاتی نیست که با جایگزینی موجودی بازی می کنیم: ما همچنین می خواهیم لباس های جدیدی را خریداری و تولید کنیم که به طور مداوم موجودی ما را بهبود می بخشد و به سبک شناسان ما کمک می کند تا از مشتریان گسترده لذت بیشتری ببرند.

و طراحی سبک های جدید برای مارک های منحصر به فرد Stitch Fix ما فرصتی عالی برای طراحی طرح های جدید برای بخش های خاصی از مشتریان است که توسط مارک های دیگر کمتر مورد توجه قرار می گیرد.

ما با الهام از الگوریتم های ژنتیک به این فرصت نزدیک می شویم: از ترکیب مجدد و جهش به همراه اندازه گیری تناسب استفاده می کنیم - مکانیسم مشابهی که طبیعت مادر در تکامل با انتخاب طبیعی از آن استفاده می کند.

اولین قدم این است که هر سبک را مجموعه ای از ویژگی ها ("ژن ها") در نظر بگیریم.

سپس مجموعه گسترده ای از سبک ها را از این طریق در نظر بگیرید و بازخورد مشتری ("تناسب اندام") که برای هر یک از آنها در دسترس داریم را در نظر بگیرید.

اکنون با ترکیب مجدد ویژگیها از سبکهای موجود و احتمالاً کمی تغییر آنها ، سبکهای جدیدی را در نظر بگیرید. توجه داشته باشید که تعداد ترکیبات احتمالی بسیار زیاد است (∏ k i ).

در مرحله بعد ، ما تا حدودی از الگوریتم ژنتیک متعارف منحرف می شویم: به جای انتخاب ساده بر اساس تناسب اندام و سپس ایجاد ترکیبات و جهش های تصادفی به عنوان نسل بعدی سبک ها ، ما تا حدودی در مورد آنچه it into our inventory.

ما ابتدا مدلی را ارائه می دهیم که نشان می دهد مجموعه ای از ویژگی ها چقدر مناسب مشتریان هدف است. سپس از این مدل برای برجسته کردن مجموعه ای از مجموعه های ویژگی استفاده می کنیم که فکر می کنیم احتمال عشق آنها زیاد است.

سپس ما با طراحان انسانی خود برای بررسی و اصلاح این مجموعه و در نهایت تولید نسل بعدی سبک ها همکاری می کنیم.

این سبک های جدید تولید می شوند و در دسترس الگوریتم استایل قرار می گیرند ، سپس در اختیار مشتریان خوشحال قرار می گیرند و چرخه تکامل ادامه می یابد.

در واقع کارهای زیادی در تیم الگوریتم های ما اتفاق می افتد.

تا کنون ما برخی از پروژه ها را در سه تیم عمودی خود لمس کرده ایم: الگوریتم های استایل ، الگوریتم های کالا و الگوریتم های مشتری.

پلتفرم داده

تیم Data Platform داده ها و زیرساخت های محاسبه-به همراه مجموعه ای از محصولات داخلی SaaS-را فراهم می کند که به دانشمندان داده های عمودی تراز شده اجازه می دهد به طور م andثر و کارآمد تجزیه و تحلیل انجام دهند ، الگوریتم های خود را بنویسند و قرار دهند آنها را وارد مرحله تولید کنند این پلت فرم به خوبی ویژگی هایی مانند توزیع داده ها ، موازی سازی ، مقیاس بندی خودکار ، بازخورد و غیره را در بر می گیرد. این امر به دانشمندان اجازه می دهد تا بیشتر بر جنبه علم تمرکز کرده و از مزایای یک سیستم مقیاس پذیر بهره مند شوند. و ، مهندسان پلت فرم داده که بر ساخت ... خوب ، پلتفرم ها تمرکز می کنند. به این معنا که آنها با منطق و الزامات تجاری که برای آنها منطقی نیست ، سنگین نیستند متن نوشته. این وظیفه دانشمندان داده کامل است. در قلب آن این ایده وجود دارد که "مهندسان نباید ETL بنویسند". تیم پلتفرم داده ما دانشمندان را قادر می سازد تا الگوریتم ها را از مفهوم به بعد توسعه دهند تولید

DOC_1066 lda2vec s j (1) , s j (2) , s j (3) s j بردار لباس j c i (1) , c i (2) , c i (3) c i i بردار مشتری A B TX c 1 feb 14 داده های مشتری درخواست های حمل و نقل انتخاب آیتم ها یادداشت های سبک شناس بازخورد مشتری واگذاری انبار مشتریان (1) توسعه سبک جدید مدیریت موجودی (2) ماشین های دولتی مدل سازی تقاضا انبار واگذاری. محاسبه انسانی همسریابی سیستم های Recomm بهینه سازی لجستیک min i j x Σ   Σ d ij  x ij s.t. x ij     { 0,1 } x ij   ≤ |S|  - 1    V, S    i,j   S, i j Σ x ij   =  2   i j Σ جایی که d ij  = | p i (y)  -  p j (y) | + | p i (x)  -  p j (x) | +  β ij if    k  s.t. (  p i (x)  >  γ k  ) & (  p i (x)  <  γ k+1  ) &         (  p j (x)  >  γ k  ) & (  p j (x)  <  γ k+1  ) then     β ij   = 2  min ( (  p i (x)  -  γ k  ), (  γ k+1  -  p i (x)  ),                (  p j (x)  -  γ k  ), (  γ k+1  -  p j (x)  ) ) else    β ij   = 0 و 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 جایی که x k   =   برخی عوامل (به عنوان مثال فصل ، ایمیل اخیر ، مرحله ماه) p   ( trans. i → j  )   =  logit  (  β 0   +  β 1   x 1   +  β 2   x 2   +  ...  ) ایالات مشتری  i Σ demand t   = n i,t  p   ( demand |  ) q ij   =  f  ( هزینه حمل و نقل ij , زمان ارسال ij , مطابقت موجودی ij , ... ) 0.235 0.172 0.624 0.382 0.832 مشتریان i انبارها j هزینه ها q ... 0.347 0.825 0.722 ... 0.533 0.874 0.193 ... ... TX CA WI تکالیف a 0 1 0 ... 1 0 0 ... 0 0 1 ... ... TX CA WI min i j a Σ Σ a ij q ij s.t. a ij =  1 i j Σ a ij { 0,1 } , i,j ... a ij <  k j j i Σ ماتریس هزینه بهینه سازی راه حل حل عناصر گم شده در ردیف این سرویس گیرنده... ? 0.83 ? 0.54 ? 0.27 ? 0.92 ? 0.13 ? ? 0.85 0.76 ? همخوانی داشتن بازخورد 0.47 0.23 ... 0.59 0.14 ... 0.62 0.90 ... صریح ویژگی های مشتری 0.21 0.74 0.53 0.26 0.85 ... ... ... ... ... صریح سبک امکانات c i s j ? ? ? ? ? ... ... ... ... ... نهفته سبک امکانات ? ? ... ? ? ... ? ? ... نهفته ویژگی های مشتری m ij = f ( تاریخ را اصلاح کنید ij , بازخورد ij , تراز نمای سبک ij , ... ) نمرات مسابقه m 0.235 0.624 0.172 ... 0.825 0.347 0.722 ... 0.193 0.874 0.533 ... ... سبک شناسان j مشتریان i تکالیف a 0 1 0 ... 1 0 0 ... 0 0 1 ... ... min i j a Σ Σ a ij m ij s.t. a ij = 1 i j Σ a ij { 0,1 } , i,j ... a ij < k j j i Σ P   (   درست_پیش بینی   )   =  β  ex_cell +  α P   (   1 |  stylist   )   +  α P   (   1 |  client   ) A B log          =    α    +    Xβ    +    Zb    ,         ~  N (0, Σ)  p 1 - p { { ثابت اثرات تصادفی اثرات نمرات مسابقه توسط فیلترینگ مشارکتی مدل سازی جلوه های مختلط شبکه های عصبی پیچشی NLP در صورت درخواست یادداشت به عنوان مثال، اندازه نهفته S M L 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 prod ingestion API load_my_data(params…) run_my_algorithm(params..) deploy_to_production(params...) کسینوس شباهت 0.62 سنجاق شده تصویر او دوست دارد ... بردار شرح تصویر از لباس در موجودی ... بردار شرح 17 42 35 86 59 17 42 35 86 59 برانگیخته برای شروع! من آن را دارم عروسی بالا آمدن هم کمد من در حال پر شدن است datetime event state 1 state 2 state 3 state 2 time demand warehouses CA warehouse TX warehouse WI warehouse PA warehouse GA warehouse replenish allocate donate deliver return (1) توسعه سبک جدید مدیریت موجودی مدل x t ( x ,  u ,  w )   جایی که x  = سطوح موجودی u  = خرید ، تخصیص و ترخیص       تصمیمات w  = پیش بینی تقاضا هزینه کل TC هزینه حمل h هزینه سفارش K مقدار سفارش هزینه ها در واحد TC* Q* Q*   demand h 1/2 ( ) 2.14 h/w 1.27 1.32 h/w 9.53 1.87 h/w 3.93 1.52 h/w 8.42 1.17 h/w 2.55 2.83 h/w 2.84 1.72 h/w 4.42 1.19 h/w 1.93 1.73 h/w 6.14 1.32 h/w 9.23 1.52 h/w 7.26 2.31 h/w 3.24 1.52 h/w 8.42 1.52 h/w 7.23 1.52 h/w 8.42 closet warehouses Initial Population Selection Recombination Mutation Next Population

ساخته شده توسط
اریک کلسون ، برایان کوفی ، تارک راچد و لیز کروز

ساخته شده با
مال مایک بوستاک D3.js و جیم والاندینگهام کد پیمایش

الهام گرفته از
استفانی یی و تونی چو آشنایی بصری با یادگیری ماشین,
ویکتور پاول و لوئیس لی پروژه بصری توضیح داده شده است,
و ایلیا کاتسوف ارسال مشکلات مربوط به داده کاوی در خرده فروشی

هدف این تور تعاملی صرفاً به اشتراک گذاشتن برخی از کاربردهای متنوع علم داده در Stitch Fix بوده است. مطمئناً ، ما زمان سختی را برای محدود کردن محدوده به ده داستان ذکر شده در بالا داشتیم - تعداد بسیار بیشتری از آنها در حال حاضر در حال تولید است و حتی بیشتر هنوز در حال قاب بندی است. با این حال ، بسیاری از آنچه ما به عنوان علم داده های کاربردی از آن یاد می کنیم ، از دیرباز به عنوان مجموعه ای متنوع از نظریه های خرد خرد اقتصادی وجود داشته است. استفاده از این مفاهیم در خارج از کتاب های درسی به طور تاریخی توسط فقدان داده و محاسبه منابع برای کاربرد عملی آنها ؛ آخرین سنگر که در حال حاضر مفاهیم را صرفاً به نظریه محدود می کند ، مردم و فرهنگ بوده اند (تغییر سازمانها بسیار دشوار است). با این حال ، به نظر می رسد که Stitch Fix باشد نسبتاً عاری از چنین موانعی است. شاید تنها کاری که ما انجام داده ایم این است که داده های غنی را از طریق یک مدل تجاری منحصر به فرد به خود اختصاص دهیم و سپس محیطی را ایجاد کنیم که در آن دانشمندان داده می توانند موفق باشند. از آنجا ، کنجکاوی ، خلاقیت و تمایل به تأثیرگذاری راه را برای بقیه هموار می کند.